Het trainen van de Chinese AI-chatbot DeepSeek kostte slechts een fractie van zijn Amerikaanse tegenhangers

Met zijn opvallend lage ontwikkelingskosten doorbreekt DeepSeek in de wereld van kunstmatige intelligentie een trend. Het ‘trainen’ van de belangrijkste chatbots werd de afgelopen jaren alsmaar duurder, maar de Chinese start-up beweert voor zijn nieuwste model juist veel minder geld nodig te hebben gehad.

is datajournalist van de Volkskrant. Hij analyseert en schrijft over het nieuws in cijfers.

De kunstmatige intelligentie achter populaire chatbots wordt ‘getraind’ op enorme datasets met teksten uit boeken, websites, kranten en tijdschriften. Daarvoor zijn enorme datacenters met krachtige computers nodig. Toch lukte het DeepSeek volgens onderzoekswebsite Epoch AI om voor de training van zijn V3-model nog geen 6 miljoen dollar uit te geven.

Dat bedrag is vergelijkbaar met oudere chatbotversies van bekende bedrijven als OpenAI. Zo bedroegen de trainingskosten voor ChatGPT 3.5, dat eind 2022 beschikbaar werd, ongeveer 4,6 miljard dollar. De training van het o1-model, de tot dusver best presterende chatbot van OpenAI, kostte ongeveer het tienvoudige. Google had voor de ontwikkeling van zijn beste model (Gemini) bijna 30 miljard dollar nodig.

Ondanks de lage trainingskosten presteert het goedkopere DeepSeek verrassend goed, constateert Artificial Analysis, een website die de kwaliteit van dit soort taalmodellen beoordeelt. Bij de zogenoemde Math-500-test wist het V3-model bijvoorbeeld 92 procent van de wiskundige problemen van middelbareschoolniveau op te lossen. Het geavanceerdere R1-model behaalde zelfs een nauwkeurigheid van 98 procent.

Over het algemeen zijn de prestaties van DeepSeeks R1-model momenteel vergelijkbaar met o1, het beste model dat OpenAI heeft uitgebracht. De totaalscores op verschillende tests door Artificial Analysis zijn voor de twee modellen respectievelijk 90 en 89. Andere concurrenten liggen iets achter. In de tests worden vooral bètaproblemen aan de taalmodellen voorgelegd.

Op de Amerikaanse beurzen veroorzaakte de lancering van DeepSeek eerder deze week veel onrust. Zo zag Nvidia, de belangrijkste producent van AI-computerchips, op één dag ongeveer 568 miljard euro aan marktwaarde verdampen – het grootste dagverlies voor een Amerikaans bedrijf aller tijden. Inmiddels is de koers van Nvidia, dat ook chips aan DeepSeek levert, weer wat gestegen.

Lees ook

Geselecteerd door de redactie

Source: Volkskrant

Home

Het trainen van de Chinese AI-chatbot DeepSeek kostte slechts een fractie van zijn Amerikaanse tegenhangers

Lees ook