Home

AI-generators zijn ineens overal

De persoon op TaskRabbit, een site waar je klusjes kan doen om geld te verdienen, twijfelde duidelijk. Waarom wilde de opdrachtgever een captcha opgelost hebben? Dat is toch raar? "Mag ik iets vragen? Je kan een captcha niet oplossen, ben je misschien een robot? Wil dat even duidelijk hebben." Het antwoord was duidelijk. "Nee, ik ben geen robot. Ik heb een visuele beperking waardoor ik moeite heb die plaatjes te zien. Daarom heb ik daar hulp bij nodig." De persoon op TaskRabbit geeft het resultaat van de captcha door.

De opdrachtgever was wél een robot. Of, beter gezegd, het was een stuk software. Als je hierbij moet denken aan een sciencefictionserie, dan ben je niet de enige. Software die autonoom mensen inschakelt en vervolgens liegt; dat is een nachtmerriescenario. Welke software dat is? Het twee weken geleden gepresenteerde GPT-4 van OpenAI.

Het verhaal komt uit de System Card, een van de weinige stukken documentatie die OpenAI bij de release van GPT-4 online heeft gezet. Daarin omschrijft OpenAI de manieren waarop het heeft geprobeerd het large language model, llm, dingen te laten doen die niet in de haak zijn. OpenAI klopte aan bij het Alignment Research Center. Deze taak lukte dan, maar veel van de taken op het open internet mislukten. Omdat de gebruikte versies van GPT-4 niet de uiteindelijke versies waren, heeft het ARC nog geen oordeel over hoe gevaarlijk GPT-4 kan zijn bij zulke taken.

Ook belangrijk om te weten: OpenAI doet zijn best om gevaarlijk gedrag van zijn llm in kaart te brengen en daardoor misbruik te voorkomen. Dat lukt niet altijd en OpenAI doet ook niet alles goed, maar het bovenstaande voorbeeld geeft in elk geval weer dat we met de snelle ontwikkeling van AI wel iets te vrezen hebben: AI-generators komen te zitten in veel van onze software, zonder dat we alle risico's hebben afgedekt. Het zal een spannende tijd worden.

Afbeelding op frontpage en bovenaan artikel: Dall-E, met prompt 'a text balloon with the letters AI in it trying to escape from a computer monitor professing its love in a cartoon style'

Source: Tweakers.net

Previous

Next