Elke week stuurt de KB drie grote kisten vol met kranten naar het scanbedrijf M&R in Kampen. Dagelijks worden daar 10.000 pagina's onder de scanner gelegd.
Het proces begint met de voorbewerking bij de Koninklijke Bibliotheek. Een team van voorbewerkers bladert pagina voor pagina de kranten door, die meestal per jaargang zijn ingebonden. De Amsterdamsche Courant uit 1813 is aan de beurt. Deze krant verscheen van maandag tot en met zaterdag. Soms zijn er speciale edities of supplementen. Ook zijn er pagina’s in afwijkende formaten of zijn exemplaren of pagina’s in de verkeerde volgorde ingebonden. Al deze informatie legt de voorbewerker vast in een database. Deze database wordt later bij het scannen gebruikt. Het papier van de oude kranten is kwetsbaar. Scheuren en vouwen in de pagina’s worden voorzichtig gerepareerd. Al deze voorbereidingen zijn nodig om de krant zo goed mogelijk onder de scanner te krijgen. Band voor band en pagina voor pagina wordt de klus geklaard.
Elke band heeft een eigen barcode waarmee de status precies te volgen is. Het scannen begint met het inlezen van de barcode. Hiermee worden de gegevens ingeladen die bij de KB in de database zijn vastgelegd. Door de krant op een verstelbare ondergrond te leggen en deze voorzichtig tegen een glasplaat aan te drukken wordt een mooi egaal vlak gecreëerd en kan de opname worden gemaakt. De gescande pagina wordt gekoppeld aan de gegevens in de database. Elke pagina wordt zo verbonden aan de juiste titel en datum.
De KB stelt hoge kwaliteitseisen aan de scans die gemaakt worden . De kwaliteit van de apparatuur en een zorgvuldige afstelling is daarom belangrijk. Elke dag begint met het controleren en zo nodig ijken van de apparatuur.
|
| Het scannen van de kranten bij M&R in Kampen. |
Alleen een digitale afbeelding van een pagina is niet genoeg voor een website. In de krant van 4 december 1813 staat een advertentie: Voor Sint Nicolaas geschenk aan de jeugd. Om deze advertentie straks op de website te kunnen vinden moet de tekst voor een computer leesbaar worden gemaakt. Zo kan in de tekst naar woorden worden gezocht. Ook kan worden gezocht op titel, op jaartal en op ‘soort’ tekst, zoals advertentie, nieuwsbericht en familiebericht. Dit maakt het mogelijk om in de grote krantendatabase heel gericht te zoeken naar bijvoorbeeld de advertentie: “Deugden-boekje, van wijlen den Hoog-Geleerden Heer J. H. Swindels, in rijm en onrijm, en versierd met vele fraai in het koper gebrachte platen, voor de prijs van slechts 18 stuivers”.
|
| Een advertentie uit de Amsterdamsche Courant van 4 december 1813. |
Om dit mogelijk te maken is een aantal stappen in het werkproces nodig. CCS, het bedrijf dat de digitalisering uitvoert, laat medewerkers vanuit Roemenie en Cambodja inloggen. De medewerkers werken op afstand aan het verbeteren van de OCR (Optical Character Recognition), zij verbeteren fouten in de krantenkoppen en kennen rubrieken toe aan de verschillende onderdelen van een pagina. Door deze inspanningen kan straks op elk woord in de tekst worden gezocht en kunnen de resultaten als afzonderlijke delen (artikelen, foto’s, advertenties, familieberichten) worden bekeken.
|
| Het nabewerken van de digitale bestanden door CCS. |
Elke dag komen er 10.000 digitale krantenpagina’s bij, die op een speciale server met een opslagcapaciteit van 70 terabyte (ca. 14.000 dvd’s) worden opgeslagen. Als alle stappen goed doorlopen zijn, de kwaliteitscontroles zijn uitgevoerd en de bestanden goedgekeurd, worden de harde schijven met de digitale bestanden naar de KB gestuurd. De kranten worden weer zorgvuldig ingepakt en teruggebracht naar de KB of naar de bruikleengever.
Dit proces is in de loop van 2008 opgezet en zal tot in 2011 blijven draaien. De eerste resultaten zullen naar verwachting in het voorjaar van 2009 te zien zijn op de website.