Grote uitgevers slepen Meta voor de rechter om AI-training - AI en business nieuws, trends, marketing

Meta krijgt opnieuw stevige juridische tegenwind. Vijf grote uitgevers, waaronder Macmillan, Hachette en McGraw Hill, hebben samen met schrijver Scott Turow een rechtszaak aangespannen tegen het bedrijf achter het populaire AI-model Llama. Volgens hen gebruikte Meta op grote schaal auteursrechtelijk beschermd materiaal zonder toestemming om zijn AI slimmer te maken.

De aanklacht is fors: Meta zou miljoenen boeken, wetenschappelijke artikels en educatieve publicaties hebben gekopieerd uit illegale online bibliotheken zoals LibGen, Sci-Hub en Anna’s Archive. Daarnaast zou het bedrijf ook datasets hebben gebruikt waarin ongeautoriseerde kopieën van boeken circuleren. De uitgevers stellen dat hun werk hierdoor zonder compensatie of toestemming werd ingezet voor commerciële AI-systemen.

“Meta copied books on a massive scale”

De zaak raakt een steeds grotere discussie in de technologiesector: mogen AI-bedrijven bestaande boeken, artikels en creatieve werken gebruiken om modellen te trainen? The Verge vat de kern van de aanklacht scherp samen:

“Meta copied books on a massive scale to train its AI models without permission from authors or publishers.”

Volgens de uitgevers gaat het niet alleen om het verzamelen van teksten, maar ook om de gevolgen daarvan. Ze beweren dat Llama soms opvallend dicht bij originele passages komt en in sommige gevallen bijna letterlijke reproducties kan genereren. Dat zou rechtstreeks concurreren met de oorspronkelijke auteurs en uitgevers.

Meta zelf houdt vol dat het gebruik van deze data onder het Amerikaanse principe van “fair use” valt. Dat juridische concept laat in bepaalde gevallen beperkt hergebruik van beschermd materiaal toe, bijvoorbeeld voor onderzoek of transformatieve toepassingen. Het bedrijf zegt zich krachtig te zullen verdedigen tegen de beschuldigingen.

AI-bedrijven steeds vaker in het vizier

De rechtszaak tegen Meta staat niet op zichzelf. De voorbije maanden kregen ook OpenAI, Anthropic en andere AI-bedrijven gelijkaardige claims van auteurs, nieuwsmedia en creatieve organisaties. De kernvraag blijft overal dezelfde: waar ligt de grens tussen innovatie en auteursrechtenschending?

Sommige rechters erkenden al dat AI-training mogelijk “transformatief” is omdat modellen nieuwe output creëren in plaats van simpelweg teksten te kopiëren. Tegelijk groeit de bezorgdheid dat schrijvers, journalisten en uitgevers inkomsten verliezen wanneer AI-systemen hun werk gebruiken zonder vergoeding.Voor de uitgevers is deze zaak daarom groter dan alleen Meta. Ze willen een precedent scheppen dat bepaalt hoe AI-bedrijven in de toekomst met auteursrechtelijk beschermd materiaal mogen omgaan.

De eisers vragen niet alleen een schadevergoeding, maar ook volledige transparantie over welke boeken en publicaties precies zijn gebruikt voor AI-training. Daarnaast willen ze dat Meta stopt met het ongeautoriseerd inzetten van hun materiaal. De uitkomst van deze zaak kan grote gevolgen hebben voor de hele AI-industrie. Als de rechtbank de uitgevers gelijk geeft, zouden technologiebedrijven mogelijk miljarden moeten investeren in officiële licenties voor trainingsdata. Wint Meta de zaak, dan krijgt de AI-sector juist meer ruimte om bestaande online content te blijven gebruiken voor de ontwikkeling van nieuwe modellen.