Inhoudsblokken

Vera Provatorova is de nieuwe researcher-in-residence van de KB. Zij doet de komende maanden onderzoek op het gebied van Named Entity Linking (NEL). Met NEL worden begrippen in tekst aan begrippen in kennisbanken gekoppeld. Naast het onderzoek bij de KB doet Vera ook nog promotieonderzoek bij het IRLab van de Universiteit van Amsterdam (UvA). 

Collecties van de KB 

Voor haar onderzoek maakt Vera gebruik van collecties van de KB. Ze maakt gebruik van historische digitale kranten (hier te bekijken) en van DBNL (hier te bekijken). In 2016 is met een deel van de krantencollectie al aan NEL gewerkt. Vera gaat proberen de resultaten van toen te verbeteren.  

Het onderzoek

Als researcher-in-residence bij de KB doet Vera onderzoek op het gebied van Named Entity Linking (NEL). Met NEL worden begrippen in tekst automatisch herkend en gekoppeld aan begrippen in kennisbanken. De computermodellen die voor NEL gebruikt worden moeten met verschillende problemen kunnen omgaan. I

n veel gedigitaliseerde teksten zitten spelfouten die zijn ontstaan door slechte tekstherkenning. Verder kan het voorkomen dat begrippen 2 betekenissen hebben: zo kan Hasselt in Nederland worden aangezien voor Hasselt in België. Tenslotte is er een gebrek aan computermodellen die goed werken met Nederlandse historische teksten. In oude teksten zijn woorden soms anders gespeld dan in moderne teksten. Vera gaat proberen om een computermodel te maken dat goed werkt met historische Nederlandse teksten. 

Named Entity Linking heeft mooie toepassingen voor bibliotheken. Zo kun je beter zoeken naar artikelen over Hasselt in Nederland als die plaats niet meer verward wordt met Hasselt in België. En door de koppeling van begrippen met een kennisbank kan je gemakkelijk meer te weten komen over de begrippen in een tekst. 

Over het researcher-in-residence-programma 

Met het researcher-in-residence-programma zoekt de KB de verbinding met de wetenschap. Ook kunnen we met dit programma onze digitale collecties onder de aandacht brengen. De KB nodigt dan ook sinds 2014 beginnende wetenschappers uit om onderzoek te doen met onze datasets en expertise.  

Kandidaten kunnen voorstellen indienen waarna een commissie van externe experts elk jaar 2 voorstellen uitkiest. De onderzoekers ontwikkelen vervolgens digitale technieken die antwoorden op hun onderzoeksvragen kunnen opleveren. Zij worden hierbij ondersteund door diverse collega’s. De resultaten publiceren we op ons onderzoeksplatform KB Lab. 

Meer weten?

Marieke Moolenaar