ANP Radiobulletins Digitaal (dataset)

De open dataset ANP Radiobulletins Digitaal bevat 1,5 miljoen gedigitaliseerde typoscripten van nieuwsuitzendingen uit het midden van de 20e eeuw (1937 – 1984). De set biedt het nieuws van elke dag, zoals het werd voorgelezen op de radio.

De Koninklijke Bibliotheek (KB) biedt deze data aan onder (semi-)vrije licenties: voor de metadata geldt een CC0-licentie, voor de individuele objecten (afbeeldingen & full-texts) geldt een CC-BY-NC-ND- licentie. De website waarop dit materiaal doorzocht kan worden is Delpher. Op deze site wordt de ANP-set de 'Delpher Radiobulletins' genoemd. Hier is ook meer achtergrondinformatie over het materiaal te vinden.

Bestanden

De papieren neerslag van 48 jaar nieuwsuitzendingen beslaat 1.474.359 typoscripten. Voor elk van de typoscripten zijn de volgende bestanden beschikbaar:

  1. Hi-res opname van het originele typoscript (JPG-formaat)
  2. Full-textbestand verkregen via automatische OCR. Hier zitten fouten in die niet gecorrigeerd zijn.
  3. Bestand met de coördinaten van elk woord van het typoscript (ALTO in XML)
  4. Metadata (MPEG21-DIDL) voor de beschrijving van het typoscript en om de samenhang van bestanden 1, 2 en 3 weer te geven.

De metadata en digitale objecten in de set beslaan ongeveer 1 TB. Zie de technische uitleg over de ANP-set (PDF, Engels) voor voorbeelden van de metadatarecords, de JPG-, OCR- en ALTO-bestanden en hoe deze opgevraagd kunnen worden via de APIs.

Voorwaarden hergebruik, bronvermelding & licenties

Gebruik bij bron-, naams- en licentievermelding de volgende formulering:

Algemeen Nederlands Persbureau (ANP) & Koninklijke Bibliotheek (KB). Bron: anp.kb.nl – [link naar object] – CC-BY-NC-ND.

Techniek

In de technische uitleg over de ANP-set (PDF, Engels) vindt u uitleg over en voorbeelden van de:

  • metadata (MPEG21-DIDL)
  • beeldobjecten (typoscripten in JPG)
  • full-text objecten (OCR in XML-formaat, ALTO in XML-formaat)
  • onze metadata download-API o.b.v. OAI-PMH
  • onze zoek-API o.b.v. SRU.

Contact & feedback

Wij waarderen het als u laat weten wanneer u van plan bent ANP-data te downloaden. We kunnen u dan ook op de hoogte brengen van eventuele veranderingen en updates van onze datasets. Ook kunnen we (de resultaten van) uw project speciale aandacht geven op onze API-pagina’s. Dit levert uw project of toepassing dan weer de nodige publiciteit op.

Stuur dus s.v.p. een korte mail naar met uw contactgegevens en een korte uitleg wat u met de data doet. Uiteraard wordt er door de KB zorgvuldig met de contactgegevens omgesprongen.

Suggesties en andere opmerkingen over onze data & API’s zijn uiteraard ook zeer welkom.

Laatste update : 21-11-2014