Wil je 100 jaar aan illustraties in gedigitaliseerde kranten met machine learning-software analyseren? Bouw je een online applicatie over Nederlandse schrijvers in de 19e eeuw? Of doe je bijvoorbeeld computationeel onderzoek naar de ontwikkeling van het Nederlands?

De digitale collecties en metadata van de KB zijn beschikbaar volgens linked data-principes, als bulkdownload, via API’s (Application Programming Interfaces) of via Wikimedia Commons. Als het auteursrecht het toestaat, kan iedereen de data gebruiken, gratis en zonder voorwaarden. Als het materiaal auteursrechtelijk beschermd is, is toegang tot de data voor wetenschappelijke onderzoeksdoeleinden vaak mogelijk. Lees meer over onze dataservices.

Digitale KB-collecties: data-onderzoek en andere toepassingen

De omvangrijke digitale collecties van de KB maken het mogelijk om met software grote hoeveelheden tekst, feitelijke gegevens of afbeeldingen uit meerdere eeuwen te analyseren, op zoek naar historische patronen of juist breuken. Wanneer verdween een woord uit het Nederlands? Vanaf wanneer waren illustraties in Nederlandse kranten in meerderheid foto’s? Wanneer schreef men positief of juist negatief over bepaalde begrippen of personen?

Daarnaast biedt al die data ook ongekende mogelijkheden om verbanden te leggen met andere collecties of data, of om de geschiedenis van Nederland tot leven te brengen via apps of online visualisaties. 
 

Toegang tot open en niet-open data

De manier van toegang verschilt per collectie of bestand en is onder andere afhankelijk van de juridische status, de technische mogelijkheden en het type (meta)data. Er wordt bovendien met regelmaat gewerkt aan nieuwe vormen van toegang.

Meestal zijn open data (dus niet auteursrechtelijk beschermd) downloadbaar zonder voorafgaande registratie. Neem voor niet-open data contact op met @email en omschrijf kort welke data je nodigt hebt en waarom. Voor wetenschappelijke onderzoeksdoeleinden bestaat vaak een regeling. Wel kan het zijn dat je eerst een contract moet ondertekenen of dat de toegang tot de data beperkt is tot het KB-gebouw.

Nieuwe mogelijkheden

Steeds meer geestes- of sociaalwetenschappelijk onderzoek met een historische component maakt gebruik van de mogelijkheden van Text and Data Mining (TDM), machine learning of vormen van kunstmatige intelligentie. Vaak vormen de digitale collecties van de KB de basis van dat onderzoek.

Jaarlijks gebruiken tientallen onderzoekers de digitale collecties van de KB om hun eigen, geavanceerde vragen te stellen en analyses uit te voeren. De digitale collecties van de KB worden op die manier vaker door software ‘gelezen’ dan door mensen. Digitale collecties van de KB vinden op deze manier ook hun weg naar andere (onder)zoekomgevingen, zoals (in willekeurige volgorde) Nederlab, Europeana, CLARIAH, Netwerk Oorlogsbronnen of Golden Agents.

Wetenschappers die de digitale collecties van de KB willen onderzoeken met nieuwe digitale methoden en technieken kunnen ook een kijkje nemen bij het KB Lab. Hier ontwikkelen we samen met wetenschappers nieuwe onderzoeksmethoden en -technieken. Daarnaast geeft het Lab toegang tot datasets die zijn ontstaan uit eerdere onderzoeksprojecten. 
 

Linked data

De collecties van de KB bestaan uit miljoenen publicaties zoals boeken, kranten en tijdschriften. Om deze op een goede manier toegankelijk te maken, zijn ze volgens een vast patroon beschreven. Deze beschrijvingen van publicaties noemen we 'metadata'. Om ze zo bruikbaar mogelijk te maken voor onderzoekers en diensten biedt de KB data aan als linked data. Lees meer over deze expertise van de KB.

Contact

Neem voor meer informatie contact op met @email.