Chatbots worden voor mensen aangezien in de Turingtest en toch bleef het stil. Dat is te verklaren

is techredacteur van de Volkskrant, gespecialiseerd in de impact van kunstmatige intelligentie op de maatschappij.

Onlangs kreeg ik een appje van iemand die zich zorgen maakt over de ontwikkeling van kunstmatige intelligentie. Zijn punt, en dat van vele anderen: als AI de mens op alle vlakken de baas is, is het te laat: we hebben dan geen controle meer.

‘Toch grappig, als het zover is, wordt er nul over geschreven.’ Hij verwees daarbij naar recent onderzoek van de Universiteit van San Diego met de kop ‘Grote taalmodellen slagen voor de Turingtest’.

De onderzoeken namen drie recente AI-modellen onder de loep en één stokoud modelletje: de in de jaren zestig door Joseph Weizenbaum ontworpen oer-chatbot Eliza.

Die Eliza is in vergelijking met de chatbots die we nu kennen heel primitief. Eliza werkt op basis van vooraf vastgestelde regels: een beslisboom in plaats van de zelflerende algoritmen die nu in zwang zijn. Improvisatie is er dus niet bij.

Ondanks haar knulligheid en het gemak waarmee menselijke gesprekspartners door de vooraf geprogrammeerde gesprekjes heen prikten, heeft Eliza het tot de AI-canon geschopt. Tot Weizenbaums eigen verbazing kenden gebruikers die met Eliza communiceerden menselijke eigenschappen aan haar toe. Dit antropomorfiseren staat sindsdien bekend als het Eliza-effect.

Een ander geliefd onderdeel van het AI-museum is de Turingtest. Het door Alan Turing in 1950 bedachte experiment was bedoeld om te bepalen of een machine intelligent gedrag kan vertonen dat niet te onderscheiden is van dat van een mens.

In de test communiceert iemand via tekst tegelijk met zowel een mens als een machine, zonder te weten wie wie is. Als de ondervrager niet kan vaststellen welke deelnemer de machine is, dan heeft de machine de test doorstaan.

Lang verhaal kort: Eliza slaagt niet voor de test. Maar GPT-4.5 van OpenAI wel, met vlag en wimpel zelfs. Na gesprekjes van vijf minuten werd GPT-4.5 in 73 procent van de gevallen als mens beoordeeld: significant vaker dan dat de ondervragers de echte menselijke gesprekspartner selecteerden. De resultaten vormen het eerste empirische bewijs dat een kunstmatig systeem een Turingtest doorstaat, aldus de jubelende onderzoekers.

Toch bleef het stil, zoals mijn (menselijke) gesprekspartner terecht per app opmerkte. Dat is verklaarbaar. De Turingtest heeft de afgelopen 75 jaar bijna mythische proporties gekregen, maar dat is vooral vanwege de aantrekkingskracht van de test, die iets complex als intelligentie platslaat tot een soort wedstrijdje Wie is de Mol.

De kritiek ligt voor de hand. Chatbots kunnen de test eenvoudig doorstaan door patronen te herkennen en menselijke reacties te simuleren zonder daadwerkelijk begrip of bewustzijn te hebben. Ook beoordeelt de test alleen het vermogen van een machine om menselijk taalgedrag te imiteren.

Is het dus zover? Ja, chatbots slagen voor de Turingtest. Maar, nee, ze zijn de mens nog niet op alle vlakken te slim af. Als dat het geval is, leest u het hier. Beloofd.

Lees ook

Geselecteerd door de redactie

Lees hier alle artikelen over dit thema

Source: Volkskrant columns

Home

Chatbots worden voor mensen aangezien in de Turingtest en toch bleef het stil. Dat is te verklaren

Lees ook