Home

Nederlandse schrijvers eisen dat Meta stopt met het gebruik van hun teksten voor AI: ‘We zijn geen gratis grondstof’

Nederlandse schrijvers, vertalers en journalisten eisen in een sommatiebrief dat Meta per direct stopt met het gebruik van auteursrechtelijk beschermd werk voor de training van zijn AI-modellen.

is techredacteur van de Volkskrant, gespecialiseerd in de impact van kunstmatige intelligentie op de maatschappij.

De teksten van de auteurs zijn onmisbaar voor AI-taalmodellen, maar zij ontvangen geen vergoeding, zo stellen de Auteursbond, de Nederlandse Vereniging voor Journalisten (NVJ) en Stichting Lira in een gezamenlijke verklaring.

Meta heeft bij de ontwikkeling van zijn AI-model Llama gebruikgemaakt van grote hoeveelheden auteursrechtelijk beschermd materiaal afkomstig uit illegale datasets, zo werd begin vorig jaar duidelijk via Amerikaanse media. Het gaat daarbij specifiek om Library Genesis (LibGen).

Deze online bibliotheek bevat miljoenen gratis te downloaden boeken en wetenschappelijke artikelen, zonder dat toestemming nodig is van de auteurs of de uitgevers. Er zijn ook Nederlandse bronnen beschikbaar. ‘Dat is in strijd met het auteursrecht en ondermijnt de economische en creatieve positie van schrijvers, vertalers en journalisten’, aldus de drie belangenbehartigers.

Datahonger heeft een prijs

De Amerikaanse site The Atlantic bouwde eerder zoekgereedschap waarmee iedereen kan zien of hij slachtoffer is geworden van de datahongerige AI-bedrijven. Ook laat de site zien welke boeken en artikelen in de trainingsset zijn terechtgekomen.

Liesbet van Zoonen, voorzitter van de Auteursbond: ‘Wij zijn niet tegen taalmodellen, maar de AI-industrie is een miljardenbusiness die nu het werk van schrijvers, vertalers en journalisten illegaal gebruikt en overneemt.’ Ze noemt het ‘niet meer dan logisch’ dat de AI-bedrijven gaan betalen: ‘Auteurs zijn geen gratis grondstof voor AI.’

Ook Thomas Bruning, algemeen secretaris van de NVJ, pleit voor ‘een eerlijke vergoeding voor journalisten en schrijvers’. Meta moet stoppen met het gebruik van illegale databronnen zoals LibGen en met het aanbieden van op die wijze getrainde AI-modellen in Europa, zo eisen ze. Ook willen ze dat Meta over de brug komt met een ‘passende regeling’.

Statistische patronen

In de VS lag Meta ook al onder vuur vanwege het gebruik van LibGen, waarvoor Meta-baas Mark Zuckerberg, met een geschat vermogen van 200 miljard dollar een van de rijkste mensen ter wereld, hoogstpersoonlijk toestemming zou hebben gegeven. Andere opties zouden te duur zijn.

De rechter oordeelde vorige zomer dat Meta’s gebruik van LibGen toegestaan was, omdat het binnen ‘fair use’ zou vallen. AI-modellen zoals Llama leren statistische patronen uit het trainingsmateriaal en reproduceren niet letterlijk die teksten, zo redeneerde de rechter.

Meta is niet het enige AI-lab dat zich moet verdedigen tegen het gebruik van beschermd materiaal (teksten, beeld, muziek) voor het trainen van zijn modellen. Zo spande The New York Times een zaak aan tegen onder andere OpenAI.

Handmatig inscannen

In een andere zaak was er gedeeltelijke vrijspraak. Anthropic, maker van chatbot Claude, kocht miljoenen fysieke boeken die medewerkers handmatig inscanden, wat volgens de rechter was toegestaan. Daarnaast zou Anthropic ook hebben gebruikgemaakt van LibGen. Voor dit gebruik trof Anthropic een schikking om verdere zaken te voorkomen. Auteurs kunnen nu een claim indienen.

In Nederland bestaat sinds kort ook een taalmodel, GPT-NL. Dit is getraind met teksten van alle grote Nederlandse nieuwsmedia, waarvoor met brancheorganisatie NDP afspraken zijn gemaakt. De eerste vijf klanten beginnen binnenkort met hun eerste projecten met dit model, zo maakte GPT-NL deze week bekend.

Alles over tech vindt u hier.

Lees ook

Geselecteerd door de redactie

Lees hier alle artikelen over dit thema

Source: Volkskrant

Previous

Next