OCLC ondersteunt KB in Linked Data ambities

29 april 2015 - De KB wil haar informatie verrijken door deze te verbinden met gerelateerde data elders op het web zodat met intelligentere zoeksystemen deze informatie beter vindbaar en bruikbaar wordt. De basis hiervoor wordt gelegd door thesauri te publiceren als linked data op het semantische web. OCLC ondersteunt de KB in deze strategie. Het betreft de thesauri voor namen, corporaties, geografische namen en trefwoorden. De gestructureerde en gecontroleerde termenlijsten zijn in de afgelopen decennia opgebouwd door de Koninklijke Bibliotheek en andere deelnemers aan het Gemeenschappelijk Geautomatiseerd Catalogiseersysteem (GGC).

De belangrijkste thesauri die beschikbaar komen zijn de Nederlandse Thesaurus van Auteursnamen, de Gemeenschappelijke Trefwoordthesaurus en Basisclassificatie en de Brinkmantrefwoorden. Deze GGC-thesauri voor namen, corporaties, geografische namen en trefwoorden zijn waar mogelijk ook voorzien naar een link naar de Virtual International Authority File (VIAF) van OCLC, om zo de verbinding te leggen naar het internationale bibliotheekveld. De VIAF is weer verbonden met grote internationale kennissystemen als DBpedia, Freebase en International Standard Name Identifier (ISNI). De thesauri worden beschikbaar gesteld in SKOS (Simple Knowledge Organization System), een W3C standaard.

Het publiceren van deze thesauri als linked data is een wens van bibliotheken die met OCLC samenwerken in de GII, de Gemeenschappelijke Informatie Infrastructuur, bestaande uit de KB, de dertien Nederlandse universiteitsbibliotheken, de PLUSbibliotheken, en de overige openbare bibliotheken, vertegenwoordigd door de VOB. Het publiceren van de thesauri als linked data bouwt voort op de activiteiten van Bibliotheek.nl, waar de afgelopen jaren is gewerkt aan een op semantische technieken gebaseerde nationale bibliotheekcatalogus (NBC+) en een Nederlandse versie van DBpedia. Door de thesauri te publiceren volgens de principes van linked data worden ze bruikbaar in het semantisch web. Voor de dataset als geheel geldt dat deze wordt vrijgegeven onder een Open Data Commons Attribution Licentie (ODC-BY). Dit impliceert gebruik dat rekening houdt met de gemeenschapszin waarin de dataset is opgebouwd en naamsvermelding van de bronhouder (OCLC).

Linked data is van groot belang voor bibliotheken, die traditioneel gegevens uit veel verschillende kennisdomeinen verzamelen. Het koppelen van gegevens maakt het ook mogelijk om informatie uit verschillende erfgoeddomeinen op een logische manier samen te brengen voor gebruikers. Een belangrijke aanleiding is daarom de vorming van het Netwerk Digitaal Erfgoed, waarin de KB met Bibliotheek.nl, het Nationaal Archief, Beeld en Geluid, de Rijksdienst voor het Cultureel Erfgoed en de Koninklijke Nederlandse Academie van Wetenschappen onder regie van het ministerie van Onderwijs, Cultuur en Wetenschap participeert. Dit Netwerk werkt aan een routekaart om erfgoed beter zichtbaar, bruikbaar en houdbaar te maken, om zo de maatschappelijke waarde van erfgoed te vergroten. Het publiceren van de bibliotheekthesauri maakt dat de bibliotheekkennis en –collecties ook onderdeel kunnen worden van het nationale netwerk van data dat hier de komende jaren gerealiseerd zal worden.

Voor meer informatie: www.kb.nl/dataservices