KB stelt rechtenvrije collecties beschikbaar voor Nederlands AI-model

Generatieve Artificial Intelligence (AI)-modellen zoals ChatGPT moeten worden getraind met bestaande data zoals tekst of afbeeldingen. De KB beschikt over grote aantallen digitale teksten in haar collecties die nu gaan bijdragen aan een ethisch verantwoord AI-taalmodel. Daarvoor heeft de KB een overeenkomst getekend met GPT-NL, het samenwerkingsverband dat dit Nederlandse taalmodel ontwikkelt.

Publieke alternatieven

Om als samenleving op een ethisch verantwoorde manier met kunstmatige intelligentie te kunnen werken, is het essentieel dat we investeren in publieke alternatieven voor AI-modellen zoals ChatGPT en Gemini. Daarmee verkleinen we onze afhankelijkheid van commerciële partijen en krijgen we als maatschappij meer controle over hoe technologie wordt ontwikkeld en ingezet.

Commerciële bedrijven trainen AI-modellen met grote hoeveelheden tekst die niet rechtmatig verkregen zijn. Bovendien weten we niet welke Nederlandse data is gebruikt en is het goed mogelijk dat voornamelijk Engelse of vertaalde teksten als trainingsdata zijn gebruikt. Deze AI-modellen verliezen daarom de nuances van Nederlandse taal en cultuur die voor sommige toepassingen noodzakelijk zijn.

Ethisch verantwoord

De KB omarmt digitale ontwikkelingen en vindt het tegelijkertijd van groot belang dat AI-bedrijven en andere organisaties op een ethisch verantwoorde wijze werken. Zo is het een voorwaarde dat het auteursrecht wordt gerespecteerd, dat er aan bronvermelding wordt gedaan en dat persoonsgegevens worden beschermd.

Het project GPT-NL vormt een belangrijke reactie op deze commerciële AI-modellen. GPT-NL ontwikkelt een ethisch verantwoord AI-taalmodel voor de Nederlandse taal en cultuur, waarbij uitsluitend rechtmatig verkregen data wordt gebruikt. De KB ondersteunt de ontwikkeling van GPT-NL van harte, juist omdat het project expliciet aandacht besteedt aan verantwoord datagebruik, eerlijke afspraken met auteursrechthebbenden en het zorgvuldig omgaan met cultureel erfgoed.

Collecties

Wij steunen dit initiatief en dragen daarom bij met alle rechtenvrije digitale teksten uit onze collecties. GPT-NL wordt momenteel getraind met deze data en de data die andere partijen beschikbaar gesteld hebben, waaronder ICTRecht, Het Utrechts Archief en De Nederlandsche Bank. Eind 2025 zal een eerste versie van GPT-NL beschikbaar zijn.

Publieke alternatieven

Ethisch verantwoord

Collecties

Meld je aan voor de KB-nieuwsbrief

Meer nieuws

KB stelt rechtenvrije collecties beschikbaar voor Nederlands AI-model

Ministerie van OCW heeft grote waardering voor functioneren van KB in uitdagende context

KB neemt Nederlandstalige Wikipedia op in archief