Technische informatie project DDD

De Koninklijke Bibliotheek werkt bij massa (tekst)digitaliseringsprojecten volgens een gestandaardiseerd proces (de workflow).

De workflow bestaat uit vijf onderdelen:

  1. Content; Vervaardigen van het gedigitaliseerde materiaal (de content).
  2. Verwerking; Controles op- en conversie van de aangeleverde content.
  3. Ontsluiting; Indexering van het tekstmateriaal en de metagegevens. Toepassing van verschillende technieken om het materiaal te ontsluiten.
  4. Opslag; Opslag van de bestanden in verschillende systemen.
  5. Beschikbaarstelling: Publicatie van de digitale bestanden op een website.

De Databank Digitale Dagbladen is een van de grootste digitaliseringsprojecten van historisch materiaal in Nederland. In een periode van vier jaar zullen gemiddeld 200.000 pagina’s per maand moeten worden geselecteerd, voorbewerkt, gedigitaliseerd, verwerkt, opgeslagen en gepubliceerd. Voor de opslag van acht miljoen pagina’s is 250 Terabyte aan opslagruimte nodig. Eén van de grootste uitdagingen van het project is de inrichting van een efficiënte workflow waarin deze capaciteit bereikt kan worden. Dit geldt zowel voor de workflow binnen de Koninklijke Bibliotheek als bij de leverancier die de digitalisering ter hand gaat nemen.

Europese aanbesteding

De digitalisering wordt uitbesteed door middel van een Europese aanbesteding. Ter voorbereiding daaraan is in mei 2007 een marktonderzoek (pdf) gedaan, waaraan veertien bedrijven hun medewerking verleenden.De bevindingen uit het onderzoek (pdf) zijn verwerkt in de specificaties voor de aanbesteding die in november 2007 door de Koninklijke Bibliotheek als Invitation to tender is gepubliceerd. De aanbesteding is gewonnen door het Duitse bedrijf CCS (Content Conversions Specialists). CCS werkt samen met M&R uit Kampen, het bedrijf waar het scannen van de kranten plaatsvindt. Vanaf begin 2008 is gestart met digitalisering van de eerste dagbladen.

Document(en)