Brave verkoopt webcontent als data voor AI-training

Brave, het bedrijf achter de gelijknamige browser en zoekmachine, verkoopt content die het van het web heeft gehaald voor training van AI-modellen. Het lijkt erop dat het bedrijf daarbij licenties en copyright niet respecteert.

Brave zegt tegen Alex Ivanovs van StackDiary dat het bedrijf toegang tot de output van de api verkoopt en niet de content zelf. De snippets zijn volgens Ivanovs 150 tot 260 woorden lang, veel langer dan snippets van bijvoorbeeld Google. Daardoor is het minder duidelijk dat de snippets van Brave onder fair use vallen, de Amerikaanse regeling waarbij je mag citeren uit auteursrechtelijk beschermd werk onder bepaalde voorwaarden.

Brave verkoopt de data in een abonnementsvorm voor training van AI-modellen, die dankzij de data betere output zouden kunnen genereren. Ivanovs merkt ook op dat Brave een optie heeft om gebruikers van de Brave-browser te laten functioneren als web crawler. Dat is een opt-infunctie, waarbij de browser kopieën van bezochte sites naar servers van het bedrijf stuurt om op te nemen in de index van de zoekmachine. Die functie staat standaard uit. Door dat systeem kunnen websitebeheerders de crawler niet uitsluiten van bepaalde pagina's, omdat het geen user agent heeft die te identificeren is.

Source: Tweakers.net

Home

Brave verkoopt webcontent als data voor AI-training