Linked Data van de KB

Op data.bibliotheken.nl wordt toegang gegeven tot de Linked Data van de Koninklijke Bibliotheek en andere bibliotheekinstellingen.

Open datasets

  • Short Title Catalogue Netherlands (STCN)
  • Titels van de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL)

GGC-thesauri en -datasets

De metadata in de zes GGC-datasets zijn beschikbaar onder een Open Data Commons Attribution License (ODC-By) . Bij gebruik moet bij de bron-, naams- en licentievermelding de volgende formulering (verwijzing naar OCLC-licentie) opgenomen worden:

Contains OCLC information made available under the ODC Attribution license. The OCLC cooperative requests that uses of derived data contained in this work conform with the Community Norms.

Techniek

De als Linked Data aangeboden sets zijn te vinden via http://data.bibliotheken.nl/. Het verkennen van de beschikbare data kan eenvoudig door met een webbrowser door de data heen te klikken. Voor specifieke zoekvragen, of als ingang om de data verder te verkennen, kan de achterliggende triplestore via het SPARQL-protocol bevraagd worden. Dit kan via http://data.bibliotheken.nl/sparql

Alle entiteiten hebben standaard een beschrijving die als een foaf:Document gemodelleerd is. De relatie tussen de entiteit zelf en de beschrijving wordt aangeven met de foaf:isPrimaryTopicOf property (of andersom met de inverse property foaf:primaryTopic). De aangeboden datasets bevatten (via void:inDataset) de beschrijvingen, niet de entiteiten zelf. Het opvragen van bijvoorbeeld alle titels uit de DBNL-dataset gaat zo in SPARQL op de volgende wijze:

?titel foaf:isPrimaryTopicOf ?beschrijving .
?beschrijving void:inDataset  .

Het is handig om hier op te letten: de beschrijvingen (foaf:Document) zijn herkenbaar aan een URI waarbij het pad-deel begint met /doc/ . De bijbehorende entiteiten hebben een identieke URI waarbij /doc/ vervangen is door /id/.

Contact & feedback

We zijn zeer benieuwd door wie en hoe de datasets worden gebruikt. Wij verzoeken u dan ook een mail met uw contactgegevens en een korte uitleg over wat u met de data doet naar dataservices@kb.nl te sturen. Feedback op onze data en API's is uiteraard ook zeer welkom. Het verstrekken van uw gegevens geeft ons ook de mogelijkheid om u op de hoogte te houden van relevante ontwikkelingen, zoals wijzigingen in de dataset of het vrijkomen van nieuwe datasets.

Short Title Catalogue Netherlands (STCN)

De Short-Title Catalogus Nederland is de retrospectieve nationale bibliografie van Nederland voor de periode 1540-1800; ook opgenomen zijn summiere beschrijvingen van Nederlandse (post-)incunabelen. Het bestand staat als wetenschappelijk bibliografisch onderzoeksinstrument aan iedereen ter beschikking. Uiteindelijk zal de STCN beschrijvingen bevatten van alle boeken die voor 1801 in Nederland zijn verschenen, en van alle boeken die buiten Nederland in de Nederlandse taal zijn gepubliceerd. De STCN wordt samengesteld op basis van collecties in binnen- en buitenland. Alle boeken zijn met het boek in de hand (in autopsie) beschreven.

Titels van de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL)

De Digitale Bibliotheek voor de Nederlandse Letteren (DBNL) is een digitale collectie van teksten die behoren tot de Nederlandse letterkunde, taalkunde en cultuurgeschiedenis van de vroegste tijd tot heden. De collectie representeert het hele Nederlandse taalgebied en komt tot stand door een samenwerking tussen de Taalunie, de Vlaamse Erfgoedbibliotheken en de Koninklijke Bibliotheek te Den Haag.

Nationale Bibliografie Totaal

De Koninklijke Bibliotheek (KB) verzamelt en bewaart in het 'Depot van Nederlandse publicaties' alle door erkende uitgevers uitgebrachte Nederlandse publicaties en daarnaast nog een groot deel van de Nederlandse publicaties die buiten de erkende kanalen verschijnen, de zogenaamde grijze literatuur. Op basis van dat materiaal produceert de Koninklijke Bibliotheek de Nederlandse Bibliografie. Daarmee levert de KB de Nederlandse bijdrage aan 'Universal Bibliographic Control'. De Nederlandse Bibliografie wordt gepubliceerd in het kader van de overeenkomst Nederlands Bibliografisch Centrum.

Nederlandse Thesaurus van Auteursnamen (NTA)

De Nederlandse Thesaurus van Auteursnamen (NTA) ook wel Persoonsnamenthesaurus genoemd, is onderdeel van het Gemeenschappelijk Geautomatiseerd Catalogiseersysteem (GGC) dat beheerd wordt door OCLC.

Wat biedt deze thesaurus? Het doel van de thesaurus is persoonsnamen te uniformeren zodat het mogelijk wordt om de publicaties van en over een auteur in de catalogus bij elkaar te brengen. Dit is de zogenaamde collocatiefunctie van de catalogus. Om deze functie te realiseren worden naams- en andere persoonsgegevens van auteurs opgeslagen, zodat onderscheid gemaakt kan worden tussen auteurs met dezelfde naam. Met behulp van deze gegevens kunnen ook de zoekfuncties in verschillende zoeksystemen verbeterd worden. OCLC verschaft deelnemende instellingen de mogelijkheid deze functie te gebruiken in vergelijkbare systemen waarin men ook tussen auteurs wil onderscheiden.

In de NTA worden de gegevens opgenomen die nodig zijn om nu of in de toekomst auteurs met dezelfde naam te kunnen identificeren en onderscheiden.. Het betreft altijd de naam, maar het kan daarbij ook gaan om pseudoniemen, spellingvarianten en de eigennaam van auteurs, om de geboorte- en sterfdatum, titulatuur en gegevens over werkrelaties, zoals beroepsaanduiding of bedrijf waar men werkzaam is.

Meer informatie Meer informatie over deze thesaurus is te vinden op de website van OCLC.

KB Corporatiethesaurus

De KB Corporatiethesaurus is een thesaurus waarmee de Depotcollectie en de catalogus van deze collectie, de Nederlandse Bibliografie online, op corporatie zijn ontsloten. Een corporatieve auteur is een instelling, commissie of organisatie die als auteur optreedt (dus geen 'natuurlijke personen').

Sinds 1 januari 2012 worden alle collecties van de Koninklijke Bibliotheek op corporatie ontsloten volgens deze thesaurus. En sinds 1 november 2013 wordt de corporatiethesaurus aan alle instellingen in het GGC aangeboden voor gebruik.

Wat biedt deze thesaurus? Het doel van de thesaurus is het uniformeren van corporaties zodat het mogelijk wordt om de publicaties van en over een corporatie in de catalogus bij elkaar te brengen. Dit is de zogenaamde collocatiefunctie van de catalogus. Om deze functie te realiseren worden naams- en andere gegevens van corporaties opgeslagen zodat onderscheid gemaakt kan worden tussen corporaties met dezelfde naam. Met behulp van deze gegevens kunnen ook de zoekfuncties in verschillende zoeksystemen verbeterd worden.

Hoe is deze thesaurus doorzoekbaar? De databases van OCLC (CBS/GGC) en WorldCat en de online retrievalsystemen [zoeksystemen] van OCLC, zoals Online Publiekscatalogi (o.a. van de KB), Picarta en WorldCat zijn doorzoekbaar op deze corporaties.

Opbouw en beheer van deze thesaurus De thesaurus is opgebouwd met ruimere en met nauwere termen, die met elkaar verbonden zijn d.m.v. Pica Productie Nummers (PPN's). Het is een lopende thesaurus waarin voortdurend aanpassingen plaatsvinden.

De kenmerkcode (kmc) waarop corporaties in het GGC worden ingevoerd is 312X. De Afdeling Documentverwerking van de Koninklijke Bibliotheek beheert deze thesaurus. Andere instellingen in het GGC kunnen voor het maken van een corporatie terecht bij deze afdeling, catalogisering@kb.nl .

Brinkmanonderwerpen

Volgens de thesaurus Brinkmanonderwerpen worden alle collecties van de Koninklijke Bibliotheek ontsloten.

Wat biedt deze thesaurus? Het doel van de thesaurus is het uniformeren van onderwerpen zodat het mogelijk wordt om de publicaties over een onderwerp in de catalogus bij elkaar te brengen. Dit is de zogenaamde collocatiefunctie van de catalogus. Met behulp van deze gegevens kunnen ook de zoekfuncties in verschillende zoeksystemen verbeterd worden.

De thesaurus bestaat naast de onderwerpstrefwoorden ook uit vormtrefwoorden en geografische trefwoorden.

Hoe is deze thesaurus doorzoekbaar? De databases van OCLC (CBS/GGC) en WorldCat en de online retrievalsystemen van OCLC zoals Online Publiekscatalogi (o.a. van de KB), Picarta en WorldCat zijn doorzoekbaar op deze onderwerpen.

Opbouw en beheer van deze thesaurus De thesaurus is opgebouwd met ruimere, nauwere en verwante termen. Deze termen zijn met elkaar verbonden d.m.v. Pica Productie Nummers (PPN's). Het is een lopende thesaurus waarin voortdurend aanpassingen plaatsvinden.

De kenmerkcode (kmc) waarop de Brinkmantrefwoorden in het GGC worden ingevoerd is 520X. De Afdeling Documentverwerking van de Koninklijke Bibliotheek beheert de thesaurus.

Gemeenschappelijke Onderwerpsontsluiting (GOO)

De Gemeenschappelijk Onderwerpsontsluiting (GOO) of Gemeenschappelijke Trefwoordenthesaurus (GTR) is tot 1 januari 2012 bijgehouden en beheerd door de Koninklijke Bibliotheek t.b.v. het samenwerkingsverband Gemeenschappelijke Onderwerpsontsluiting.

GOO was ontwikkeld om de onderwerpsontsluiting door wetenschappelijke bibliotheken gezamenlijk uit te voeren als onderdeel van het Gemeenschappelijk Geautomatiseerd Catalogiseersysteem (GGC) van Pica, later OCLC. De deelnemende bibliotheken maakten bij de beschrijving van titels in het GGC gebruik van zowel de Nederlandse Basisclassificatie als van een gedetailleerd woordsysteem, de GOO-trefwoordenthesaurus (GTT).

Door de opheffing van het Samenwerkingsverband zijn de Nederlandse Basisclassificatie, de Gemeenschappelijke Trefwoordenthesaurus en de onderwerpsgegevens over gegaan naar OCLC. OCLC wil bibliotheken die het instrumentarium of de data van GOO en de Nederlandse Basisclassificatie willen blijven gebruiken naar vermogen faciliteren.

Meer informatie http://www.ukb.nl/goo