Wat kun je in onze dataset Delpher kranten vinden? En hoe gebruik je de dataset? In Delpher kranten vind je 2 miljoen gedigitaliseerde kranten uit de jaren 1618 tot 1995. De bestanden zijn voor een deel vrij toegankelijk en te downloaden.

Wat zit er in Delpher kranten?

Wil je weten uit welke landen in de 18e eeuw nieuws werd gepubliceerd en uit welke niet? Of wil je nagaan voor welke producten er reclame werd gemaakt in de Nederlandse dagbladen tijdens de Tweede Wereldoorlog? Met Delpher kranten kun je onderzoek doen in historische kranten. Ook voor breder geschiedkundig onderzoek is deze dataset interessant. Hij biedt een inkijk in wat er speelde in de maatschappij. 

De collectie bestaat uit bijna 2 miljoen kranten uit de jaren 1618 tot 1995. Het zijn edities van alle jaargangen van de belangrijkste landelijke Nederlandse kranten, zoals De Telegraaf, De Volkskrant en Het Parool, aangevuld met een selectie van regionale en koloniale kranten. De dataset bestaat uit scans van de gedrukte pagina’s voorzien van OCR en woordcoördinaten. Van elke krant is een doorzoekbare PDF beschikbaar. Er zijn zowel beschrijvende als structurele metadata voorhanden. Regelmatig worden er kranten toegevoegd.

Alle kranten uit deze collectie zijn ook doorzoekbaar met Delpher.

Hoe is de informatie beschikbaar?

 Voor elk van de krantenafleveringen zijn de volgende bestanden beschikbaar:

Voor elke gescande pagina zijn de volgende bestanden beschikbaar:

  • de afbeelding (JPEG 2000)
  • de tekst (OCR in XML)
  • de coördinaten van elk woord op een pagina (ALTO)
     

Voorwaarden voor hergebruik

De data in Delpher kranten is deels vrij toegankelijk. De KB streeft ernaar om informatie zo open mogelijk te ontsluiten, maar dit is niet altijd mogelijk omdat er soms nog auteursrecht op kranten ligt. 

Gebruik van deze krantencollectie valt, op basis van het auteursrecht, uiteen in twee regimes. Kranten oorspronkelijk langer dan 140 jaar geleden gepubliceerd, vallen in het publieke domein. Er rusten dus geen rechten meer op. Kranten van recentere datum zijn soms nog auteursrechtelijk beschermd en op aanvraag beschikbaar voor onderzoeksdoeleinden, bijvoorbeeld door wetenschappers, onderzoekers, docenten of (data)journalisten.

We bieden verschillende mogelijkheden aan om de data te verkrijgen:

  1. Er zijn 2 API’s beschikbaar: een metadata-harvest-API op basis van OAI-PMH en een zoek-API op basis van SRU. Handleidingen voor deze API’s worden ter beschikking gesteld nadat rechtmatige toegang is verkregen via @email. Let op: enige programmeervaardigheden zijn een vereiste.
     
  2. Het Delpher open krantenarchief bevat de teksten (OCR, ALTO, XML) van alle kranten uit de periode 1618 t/m 1879. Het archief is 111 GB groot en opgesplitst in 23 zip-bestanden.

Maatwerk is in sommige gevallen mogelijk. Stel je vraag via @email.
 

Contact en feedback

We zijn benieuwd door wie en hoe de kranten worden gebruikt. We verzoeken je dan ook een mail met je contactgegevens en een korte uitleg over wat je met de data doet naar @email te sturen. Feedback is uiteraard ook welkom. Het verstrekken van je gegevens geeft ons ook de mogelijkheid om je op de hoogte te houden van relevante ontwikkelingen, zoals wijzigingen in de dataset of het vrijkomen van nieuwe datasets.