KB stelt rechtenvrije teksten beschikbaar voor Nederlands AI-model
De Koninklijke Bibliotheek (KB) stelt een groot aantal digitale, rechtenvrije teksten uit haar collecties beschikbaar voor de ontwikkeling van een ethisch verantwoord Nederlands AI-taalmodel. Hiervoor is een samenwerkingsovereenkomst gesloten met GPT-NL, het samenwerkingsverband dat dit taalmodel ontwikkelt.
GPT-NL is opgezet als alternatief voor commerciële AI-modellen zoals ChatGPT en Gemini. Het doel is om een taalmodel te bouwen dat specifiek is toegesneden op de Nederlandse taal en cultuur, met nadruk op ethisch en zorgvuldig datagebruik. Alle gebruikte gegevens zijn op rechtmatige wijze verkregen. De KB ondersteunt GPT-NL, juist vanwege de expliciete aandacht voor verantwoord datagebruik, heldere afspraken met auteursrechthebbenden en respectvolle omgang met cultureel erfgoed.
Voor de training van GPT-NL worden momenteel alle rechtenvrije digitale teksten uit de collecties van de KB ingezet, naast data die beschikbaar is gesteld door onder andere ICTRecht, Het Utrechts Archief en De Nederlandsche Bank. De eerste versie van GPT-NL wordt eind 2025 verwacht.
GPT-NL is een Nederlands taalmodel dat speciaal ontwikkeld wordt als ethisch en transparant alternatief voor grote commerciële AI-taalmodellen zoals ChatGPT (van OpenAI) en Gemini (van Google).
Wat is het precies?
GPT-NL is een kunstmatig intelligent taalmodel dat getraind wordt op Nederlandstalige teksten. Het doel is om een model te maken dat goed omgaat met de Nederlandse taal, cultuur, normen en waarden.
Wie zit erachter?
GPT-NL is een samenwerkingsproject van Nederlandse publieke en maatschappelijke organisaties, waaronder:
-
TNO (Nederlandse organisatie voor toegepast-natuurwetenschappelijk onderzoek)
-
Nederlands Instituut voor Beeld & Geluid
-
Universiteiten
-
De KB (Koninklijke Bibliotheek)



