In het voorjaar van 2010 is het zover. Dan zal de eerste versie van de website – met naar schatting zo’n 1 miljoen pagina’s – voor iedereen beschikbaar zijn. Ondertussen wordt er achter de schermen hard gewerkt om alles technisch voor elkaar te krijgen: er zijn een zestal nieuwe servers aangeschaft, de opslagruimte is uitgebreid en het indexeren van alle artikelen (naar schatting 64 miljoen bestanden) loopt op volle toeren.
Voor de Koninklijke Bibliotheek (KB) is dit het grootste digitaliseringsproject dat tot nu toe is uitgevoerd. Een team van tien medewerkers verwerken elke week 50.000 krantenpagina’s. Het materiaal wordt per nummer beschreven en gereedgemaakt voor transport naar het bedrijf in Kampen, waar de kranten worden gescand. Na het scannen volgt een bewerking die elke pagina opdeelt in artikelen, zoals nieuwsberichten, familieberichten, illustraties met onderschrift en advertenties. Ook wordt elke pagina ge-OCR’d (machineleesbaar gemaakt) met een handmatige correctie voor de koppen van de artikelen.
Het gehele proces levert per week zo’n 610.000 digitale bestanden op. Deze bestanden – zo’n 20 MB per pagina - vormen de bouwstenen voor de website. Daarmee zijn de kranten straks op elk woord in de tekst te doorzoeken, en zijn selecties mogelijk op titel, verspreidingsgebied, soort artikel, periode, plaats van uitgave of elke gewenste combinatie.
Aan het einde van 2011 wordt het project afgerond en zal de website in totaal 8 miljoen krantenpagina’s bevatten. Circa 1500 verschillende lokale, regionale, landelijke en koloniale dagbladen uit de periode 1618-1995 zullen dan voor iedereen online beschikbaar zijn. Het is de bedoeling dat na de lancering van de eerste versie van de website gedurende het hele project periodieke updates plaatsvinden met nieuwe krantentitels.