Open data

30 november 2012 Steven Claeyssens Nederlandse geschiedenis en cultuur

Twee omvangrijke collecties gedigitaliseerd Nederlands tekstueel erfgoed hebben hun ketenen afgeworpen en zijn sinds kort laagdrempelig beschikbaar voor ontwikkelaars, onderzoekers en andere creatieve geesten.

De afbeeldingen, de bijbehorende metadata en natuurlijk de teksten zelf uit Early Dutch Books Online en Staten-Generaal Digitaal (SGD) zijn middels een API (Application Programming Interface) op basis van SRU of OAI-PMH grotendeels vrij te gebruiken. Tienduizend achttiende-eeuwse boeken en bijna twee eeuwen verslaglegging uit de Eerste en de Tweede Kamer vormen de voorhoede van een nieuwe dienst van de KB: dataservices.

Dataservices

De komende maanden worden meer digitale collecties bevrijd. Met de publicatie van een korte handleiding worden ze als dataset aan de wereld voorgesteld. De technische sleutels gaan vergezeld van zo open mogelijke juridische do’s and don’ts, gebaseerd op creative commons-licenties. De do’s nodigen uit om de data in bulk of vanuit een eigen applicatie een nieuwe bestemming te geven. De eerste twee datasets werden mede mogelijk gemaakt door de universiteitsbibliotheken van Leiden en Amsterdam (EDBO) en de Tweede Kamer der Staten Generaal (SGD). Beide sets kunnen ook gevonden worden op het datablog van Open Cultuur Data en het dataregister van overheid.nl.

Digital humanities

Zoals de meeste bevrijdingen zijn ook deze bevrijdingen grotendeels schijn. Publicaties waar geen auteursrecht meer op rust zijn hoe dan ook publiek domein, en voor onderzoeksdoeleinden opende de KB jaren geleden al de digitale achterpoorten. Meer dan een onderzoeksgroep creëerde intussen een gespecialiseerde digitale omgeving om de kamerverslagen uit Staten-Generaal Digitaal of de miljoenen pagina’s historische kranten te ondervragen vanuit de eigen interesse. Vorige week nog kwamen in de KB de onderzoekers van BILAND bijeen om de voortgang van hun speurtocht in de kranten naar de rol van eugenetica en erfelijkheid in het Nederlandse publieke debat voor de Tweede Wereldoorlog te bespreken. Een sprekend voorbeeld van wat in academische kringen inmiddels bekendheid geniet onder de noemer digital humanities of ehumanities: het brede onderzoeksveld waar de humaniora en de krachten van het digitale universum elkaar de laatste jaren steeds vaker met goed gevolg ontmoeten. Digitale datasets, zoals de KB die de afgelopen jaren heeft opgebouwd, vinden daar hun natuurlijke habitat.

Digitaal erfgoed

Maandag 3 en dinsdag 4 december wordt dat breukvlak tussen digitaal erfgoed en wetenschappelijk onderzoek in Nederland in kaart gebracht tijdens de Digitaal Erfgoedconferentie georganiseerd door DEN en CATCHPlus. Wij zijn er in ieder geval bij.

Op de hoogte blijven over oude en nieuwe datasets? Iets moois gebouwd op basis van de data? Mail vooral: dataservices@kb.nl.