Wat is GPT-NL?

GPT-NL is een taalmodel (large language model; LLM) dat is ontwikkeld als een verantwoord, Nederlands alternatief voor bestaande modellen. Taalmodellen zijn een type kunstmatige intelligentie (AI) die zijn getraind om menselijke taal te analyseren, er patronen in te herkennen en zelf te genereren. GPT-NL is een initiatief van TNO, SURF en het NFI en getraind op Snellius, de supercomputer van Nederland. GPT-NL zal eind 2026 voor de zakelijke markt worden gelanceerd.

De KB is een ‘launching partner’ en zit in de ‘contentboard’ van GPT-NL. Wat houden beide in?

De content board van GPT-NL bestaat uit partijen die data leveren aan het taalmodel. Zij vormen samen de belangenvertegenwoordiging voor de partijen die hun data ter beschikking hebben gesteld voor het trainen van GPT-NL.

De launching partners zijn de eerste partijen die met GPT-NL zogeheten ‘feasibility studies’ (haalbaarheidsonderzoeken) doen. Dit zijn wetenschappelijk onderzoeken waarbij GPT-NL wordt getest in de praktijk. De resultaten uit deze onderzoeken worden direct meegenomen voor de ontwikkeling van de eerste versie van GPT-NL. 

Als onderdeel van de content board en als launching partner draagt de KB dus zowel bij aan de dataset om het model te trainen, als aan het testen van het taalmodel in de praktijk. 

Waarom werkt de KB samen met GPT-NL?

De KB vindt het van belang dat er een verantwoord, Nederlands alternatief komt voor de bestaande commerciële aanbieders van taalmodellen. GPT-NL werkt aan de ontwikkeling van een AI-model voor de Nederlandse taal en context, die op basis van kwalitatief hoogwaardige data betrouwbare informatie levert aan gebruikers. Als KB dragen we er graag aan bij dat GPT-NL uiteindelijk onderdeel wordt van een hoogwaardig en pluriform data-ecosysteem. 

Een tweede reden waarom de KB de samenwerking met GPT-NL is aangegaan is omdat beide partijen belang hechten aan het gebruik van rechtmatig verkregen data. Zo heeft de KB alleen ‘publiek domein-data’ aan GPT-NL geleverd; geschreven erfgoed waarvan de auteursrechten bijvoorbeeld zijn verlopen. Net als GPT-NL vindt de KB het van belang dat bronnen transparant en herleidbaar zijn en dat auteursrechthebbenden een eerlijke plek krijgen in de ontwikkeling van technologie. Zo zal GPT-NL ook een deel van de opbrengsten laten terugvloeien naar auteursrechthebbenden. 

De KB en GPT-NL gaan in 2026 een ‘feasibility study’ (haalbaarheindsonderzoek) van 6 maanden uitvoeren. Wat houdt dat onderzoek in?

De ‘feasibility study’ die de KB nationale bibliotheek samen met GPT-NL uitvoert, heeft als doel meer inzage te bieden in de toepasbaarheid van AI binnen het collectiezoeksysteem van de KB. Voor deze studie wordt gebruikt gemaakt van de rechtenvrije dataset (materiaal ouder dan 140 jaar) van het KB-platform Delpher.nl. Als specifieke casus wordt er een RAG-assistent ontwikkeld die als doel heeft gebruikers te helpen aan een treffende onderzoeksintroductie. Dit levert de assistent-gebruikers niet langer duizenden mogelijke Delpher-zoekresultaten op, maar een beknopte, relevante selectie bronnen. 

De resultaten van het onderzoek leveren GPT-NL inzichten op over het type antwoorden dat het taalmodel geeft, terwijl de KB meer leert over mogelijke toekomstige AI-toepassingen voor haar gebruikers.

Wat kunnen mensen straks met deze Nederlandse AI-tool doen?

GPT-NL is ontwikkeld voor de zakelijke markt. Dat wil zeggen dat Nederlanders niet zelf GPT-NL kunnen gebruiken zoals consumenten nu gebruik maken van bijvoorbeeld ChatGPT, Le Chat, Claude of Gemini. Organisaties in Nederland kunnen straks voor specifieke taken of gebruikscasussen kiezen voor GPT-NL. Denk aan het samenvatten van teksten, het versimpelen van brieven, of het creëren van een behapbare onderzoeksopzet. 

Wat streeft GPT-NL na?

GPT-NL streeft naar een digitaal autonoom Europa waarbij verantwoorde innovatie de norm is. GPT-NL wil laten zien dat het mogelijk is om - in overeenstemming met contentleveranciers - tot technologie te komen die goed werkt voor specifieke taken. Daarnaast is een doel om in Nederland en Europa meer te leren over hoe deze technologie werkt, door in de ontwikkeling van GPT-NL transparant te zijn over de data die erin zit en de keuzes die zijn gemaakt.  

Wat is het verschil tussen GPT-NL en andere taalmodellen?

In tegenstelling tot veel modellen die beschikbaar zijn op de consumentenmarkt, is GPT-NL gebaseerd op een specifiekere database (met data die afkomstig zijn van onder meer de KB, het Instituut voor de Nederlandse Taal en het ANP). Hierdoor is het model ook ontwikkeld voor het uitvoeren van specifiekere taken, zoals samenvatten of tekstversimpeling. Grotere taalmodellen die gebaseerd zijn op grotere datasets, zoals bijvoorbeeld ChatGPT, kunnen ook generiekere vragen beantwoorden. Denk dan aan suggesties voor leuke vakantie-bezienswaardigheden, of een makkelijk recept voor een eetgezelschap van 5. Doordat GPT-NL is ontwikkeld voor specifiekere toepassingen binnen de Nederlandse context, is er met minder data een model ontwikkeld dat toch goed werkt. 

Wordt GPT-NL gratis?

De subsidievoorwaarden achter GPT-NL stellen dat de kosten voor de instandhouding terugverdiend dienen te worden, wat betekent dat het taalmodel niet zomaar gratis of onder een open-source licentie aangeboden kan worden. GPT-NL zal via licenties beschikbaar worden. De licentie voor zakelijk gebruik zal met een marktconform tarief worden aangeboden. De licentie voor onderzoek zal voor een symbolisch bedrag of gratis worden aangeboden. 

Welke partijen nemen nu allemaal deel aan GPT-NL?

Er zijn zowel partijen die data hebben aangeleverd, als partijen die nu samen met GPT-NL een feasibility study uitvoeren om het model te testen. 

De data providers zijn onder meer de KB, De Nederlandsche Bank, en de VNG. Naast de feasibility study bij de KB, lopen er ook drie feasibility studies bij het ministerie van BZK en voor de website Overheid.nl. Daarnaast loopt er een feasiblity study bij TNO en het NFI.