Automatisch metadateren bij de KB

Wat is automatisch metadateren precies? En waarom is het van belang? Alle boeken, kranten en tijdschriften die binnenkomen bij de KB, komen in de KB-catalogus te staan. Van elk werk schrijven we op wie de auteur is, wanneer het verschenen is, bij welke uitgever, wat het formaat is, enzovoorts. Automatiseringen moeten de catalogiseerprocessen van de KB optimaliseren en toekomstbestendig maken. 

Wat is automatisch metadateren?

Bij het automatisch metadateren maken we gebruik van Artificial Intelligence (AI), oftewel kunstmatige intelligentie. Met behulp van deze technologieën willen we automatisch metadata toekennen aan nieuwe werken in onze collectie. Het catalogiseren gebeurt nu nog handmatig door een gespecialiseerd team van catalogiseerders, maar een simpele titelbeschrijving bestaat al snel uit 20 of 30 verschillende velden. Bij complexe titels zijn dat er nog meer. 

Door de jaren heen werkte de KB aan verschillende projecten om de mogelijkheden van automatisch metadateren met AI te onderzoeken. Eén daarvan is de Demosaurus. Deze kende koppelingen naar thesauri toe voor auteurs en trefwoorden met behulp van de Finse tool Annif. Meer recentelijk draaide de KB een pilot die helpt bij het catalogiseren van gedoneerde fysieke boeken uit de retrocollectie: de Retrotool.

De Retrotool

De Retrotool genereert op basis van foto’s van de titelpagina en het colofon een groot aantal van de benodigde velden automatisch. Dit bespaart de catalogiseerders tijd en moeite, omdat zij alleen hoeven te controleren of deze velden kloppen en aanvullingen hoeven te doen waar nodig.

Deze tool:

  • Werkt met een documentcamera, OCR (Optical Character Recognition) en een LLM (Large Language Model) om informatie uit foto’s van de titelpagina en het colofon te halen. Denk bijvoorbeeld aan gegevens over de titel, auteur en uitgever.
  • Kijkt rechtstreeks in onze catalogus om snel en effectief dubbelen te identificeren.
  • Kan met minimale inspanning van de catalogiseerder een basistitelbeschrijving opleveren, die de catalogiseerder vervolgens controleert en afmaakt.
  • Handelt niet zelfstandig. De eindverantwoordelijkheid ligt altijd bij de catalogiseerders. Zij zorgen ervoor dat de beschrijving correct in de catalogus terechtkomt.

Deze video laat zien hoe de Retrotool werkt.

Voor wie ontwikkelen we het automatisch metadateren?

Automatisch metadateren helpt de catalogiseerders van de KB. Zij kennen nu nog metadata met de hand toe. Automatisch metadateren moet hen ondersteunen en het beschrijven van titels minder arbeidsintensief maken. Van het werk van de catalogiseerders profiteren uiteindelijk onze lezers en onderzoekers: een goede titelbeschrijving zorgt dat zij de werken vinden die ze zoeken. De tijdswinst die dit soort tooling oplevert, houdt het aanbod van de KB daarnaast zo actueel mogelijk. 

Kunstmatige intelligentie en de KB

Kunstmatige intelligentie ontwikkelt zich snel en wordt steeds belangrijker in de bibliotheekwereld en in de geesteswetenschappen. Naast de vele mogelijkheden brengt het gebruik van AI ook uitdagingen met zich mee. Elke AI-oplossing die we ontwikkelen, moet namelijk zorgvuldig omgaan met onze data. De KB houdt de ontwikkelingen nauwlettend in de gaten en beraadt zich over de verantwoorde inzet van AI.

Automatisch metadateren en de KB-missie

Door automatisch metadateren willen we onze collecties sneller en beter vindbaar maken voor lezers en onderzoekers. Zo dragen we bij aan een slimmer, creatiever en vaardiger Nederland.

Met wie werkt de KB samen?

De Retrotool is door een externe, AI-gespecialiseerde partij ontwikkeld in opdracht van de KB. Hierbij is er nauw samengewerkt met onze catalogiseerders om de tool zo goed mogelijk op hun wensen en behoeften aan te laten sluiten. Daarnaast moeten de beschrijvingen voldoen aan de kwaliteitsstandaarden van de KB. 

Wat nu?

In het najaar van 2024 is de pilot van de Retrotool succesvol afgerond. De tool wordt de komende tijd actief ingezet voor de verwerking van donaties. Daarnaast bouwen we voort op de ervaring die met de Demosaurus en de Retrotool is opgedaan en treffen we gedurende 2025 voorbereidingen voor een structurele, breed inzetbare oplossing. Voor meer informatie over de Retrotool en het vervolgtraject kun je contact opnemen met Marie Buesink, coördinator vernieuwing, via @email