Meta-ceo Mark Zuckerberg keurde het gebruik van een LibGen-dataset met gepirate e-books goed om de Llama-llm te trainen. Dat zegt een groep van Amerikaanse auteurs die in 2023 een rechtszaak hebben aangespannen tegen Meta.
De groep beweert in een nieuw rechtbankdocument dat Zuckerberg wist waar de dataset vandaan kwam en toch het gebruik had goedgekeurd. Ook zou hij meerdere keren zijn gewaarschuwd door zijn eigen personeel over het gebruik van illegaal verkregen boeken. Volgens een intern bericht die in het document wordt geciteerd zou het gebruik van een database met gepirate inhoud de onderhandelingen van Meta met toezichthouders kunnen verzwakken.
Komiek Sarah Silverman en auteurs Christopher Golden en Richard Kadrey spanden in 2023 een rechtszaak aan tegen Meta en Open AI. De groep, waar inmiddels meer auteurs zich bij hebben gevoegd, beschuldigen de bedrijven voor het gebruiken van hun werk om Llama en ChatGPT te trainen, schreef The Guardian destijds. De e-books waarmee de modellen worden getraind zouden illegaal verkregen zijn en uit datasets van zogeheten shadow libraries, zoals LibGen, komen.
Source: Tweakers.net