DBNL-dataset

Welke romans waren lang geleden populair? Hoe worden vrouwelijke en mannelijke personages beschreven? Is literatuur meetbaar? In de DBNL-dataset vind je meer dan 5 miljoen gedigitaliseerde pagina’s Nederlandstalige taal- en letterkunde. De bestanden zijn voor een deel vrij toegankelijk en te downloaden.

Wat vind je in de DBNL-dataset?

In de DBNL-dataset kun je onderzoek doen naar Nederlandse en Vlaamse taal- en letterkunde van de middeleeuwen tot vandaag. Ook de Limburgse, Friese, Surinaamse en Zuid-Afrikaanse literatuur zijn vertegenwoordigd.

De dataset bestaat uit gedigitaliseerde teksten, handmatig gecorrigeerd door een redactie, met bijbehorende metadata. In de collectie vind je Middelnederlandse literatuur, maar ook klassieke romans. Daarnaast bevat de dataset tijdschriften uit de neerlandistiek, zoals De Gids en De Revisor.

Hoe is de informatie beschikbaar?

Van elk boek of tijdschrift is beschikbaar:

  • de (gecorrigeerde) tekst (TEI XML)
  • een doorzoekbare PDF (gebaseerd op de XML)

Vaak is ook beschikbaar:

  • een ePub
  • een PDF van de oorspronkelijke scan van het werk

Van teksten waarvan geautomatiseerd en met zekerheid kon vastgesteld worden dat ze niet langer auteursrechtelijk beschermd zijn, is een ZIP-bestand met txt-bestanden, plus een csv-bestand met metadata beschikbaar.

Voorwaarden voor hergebruik

De data in de DBNL-dataset zijn voor een deel vrij toegankelijk. De KB streeft ernaar om informatie zo open mogelijk te ontsluiten. Dat kan alleen niet altijd omdat er soms nog auteursrecht op teksten ligt.

Gebruik van deze dataset valt, op basis van het auteursrecht, uiteen in 2 mogelijkheden. Werken waarvan de maker langer dan 70 jaar geleden overleden is, vallen in het publieke domein. Je mag ze dus vrij gebruiken. Een groot deel van deze werken is als ZIP-bestand beschikbaar. Andere werken zijn auteursrechtelijk beschermd en op aanvraag beschikbaar voor onderzoeksdoeleinden, bijvoorbeeld door wetenschappers, onderzoekers, docenten of journalisten. Vraag hiervoor toegang via @email.

Soms bieden we maatwerk. Stel je vraag via @email.

Contact en feedback

We zijn benieuwd wie onze teksten gebruikt en hoe. We verzoeken je dan ook een mail te sturen met je contactgegevens en een korte uitleg over wat je met de data doet naar @email. Feedback is natuurlijk ook welkom. Het verstrekken van je gegevens geeft ons ook de mogelijkheid om je op de hoogte te houden van relevante ontwikkelingen, zoals wijzigingen in de dataset of het vrijkomen van nieuwe datasets.