Europeana Newspapers

Kranten vormen een belangrijk onderdeel van bibliotheekcollecties en zijn interessant voor een breed publiek. Veel bibliotheken zijn dan ook bezig met het digitaliseren en beschikbaarstellen van hun krantenmateriaal. De toegang tot deze collecties is nog steeds vrij versnipperd, onder andere door de verschillende ingangen per bibliotheek, ontoereikende OCR (Optical Character Recognition) resultaten en problemen met metadata en segmentatie.

In het project Europeana Newspapers werkte een groep van 18 Europese instituten drie jaar samen om deze problemen op Europees niveau aan te pakken en zo de krantencollecties beter toegankelijk te maken. Meer dan 10 miljoen gedigitaliseerde krantenpagina’s zijn toegevoegd aan Europeana.

Europeana Newspapers is als ICT-PSP project, type Best Practice Network gefinancierd door de Europese Commissie. Dit houdt in dat er wordt gewerkt aan praktische toepassingen van applicaties en services die in andere projecten zijn ontwikkeld, waaronder bijvoorbeeld enkele applicaties uit IMPACT.

Kwaliteitsslag

Het project was zowel gericht op aggregatie als op verrijking van het krantenmateriaal voor The European Library en Europeana en zal werken aan oplossingen voor diverse problemen op het gebied van gedigitaliseerde kranten, zoals:

  • ­Het gebruik van verrijkingsmethoden op het gebied van OCR, segmentatie van artikelen, Named Entity Recognition (NER) en paginaclassificatie om de zoekfunctionaliteit en presentatie voor bezoekers van Europeana te verbeteren (bijvoorbeeld het zoeken op artikelniveau);
  • Kwaliteitsevaluatie van geautomatiseerde verrijkingstechnologieën;
  • Transformatie van lokale metadata volgens het Europeana Data Model (EDM);
  • Aanbevelingen voor het gebruik van metadata voor historische kranten in nauwe samenwerking met belanghebbenden uit de publieke en private sector.

Alle bibliotheken die deelnemen aan het project leveren hun full-text en gedigitaliseerde krantenmateriaal vrij van juridische restricties aan Europeana. Speciale aandacht gaat uit naar de kranten gepubliceerd tijdens de Eerste Wereldoorlog, als belangrijke toevoeging aan de bronnen die al verzameld zijn tijdens het vorige project Europeana Collections 1914-1918.

Europeana Newspapers is begonnen op 1 februari 2012 met een doorlooptijd van 3 jaar.

De Koninklijke Bibliotheek (KB), nationale bibliotheek van Nederland, leidde het werkpakket ‘Verrijking van gedigitaliseerde kranten’, terwijl The European Library verantwoordelijk was voor het werkpakket ‘Aggregatie en presentatie van gedigitaliseerde kranten voor Europeana’. Ook een gedeelte van het historische krantenmateriaal van de KB zal via dit project op artikelniveau in Europeana worden aangeboden.

Meer informatie is beschikbaar via de websitehttp://www.europeana-newspapers.eu, of meld je aan voor de nieuwsbrief om op de hoogte te blijven.

Deelnemers project

  1. Staatsbibliothek zu Berlin (coördinator)
  2. Koninklijke Bibliotheek, nationale bibliotheek van Nederland
  3. National Library of Estonia
  4. Österreichische Nationalbibliothek
  5. National Library of Finland
  6. Staats- und Universitätsbibliothek Hamburg
  7. Bibliothèque nationale de France
  8. National Library of Poland
  9. University of Salford
  10. CCS Content Conversion Specialists GmbH
  11. Stichting LIBER
  12. National Library of Latvia
  13. National Library of Turkey
  14. University Library of Belgrade
  15. University of Innsbruck
  16. Landesbibliothek Dr. Friedrich Tessmann
  17. The British Library
  18. Europeana Foundation

Document(en)