Vergeet de chatbot, hier komen de AI Agents, die je avondje uit kunnen regelen

Na ChatGPT zijn de AI Agents in aantocht. Die kunnen allerlei taken uit handen nemen door computers te bedienen zoals mensen dat kunnen. Handig en efficiënt, maar niet zonder gevaar.

is techredacteur van de Volkskrant, gespecialiseerd in de impact van kunstmatige intelligentie op de maatschappij.

‘Reserveer een tafel voor acht personen in een goed gewaardeerd sushi-restaurant in het centrum van Amsterdam om 18.00 uur aanstaande vrijdag.’ Wie geen menselijke assistent tot zijn beschikking heeft, zal zelf aan het werk moeten. Waarderingen doorakkeren, de site van het restaurant bezoeken, beschikbaarheid controleren, gegevens invullen, noem maar op.

Alhoewel? Precies dit soort vervelend werk kunnen zogenoemde AI Agents uit handen nemen, zo is de belofte van bedrijven zoals OpenAI. De maker van ChatGPT kondigde onlangs Operator aan; zijn eerste assistent die zelfstandig het web op gaat en de muis en toetsenbord kan bedienen zoals een mens dat ook doet. Maar dan virtueel.

Een demo onder leiding van topman Sam Altman laat zien hoe de AI Agent een browsersessie begint, informatie zoekt, rondklikt, formulieren invult en uiteindelijk de gewenste taak volbrengt. In een dialoogvenster wordt de opdrachtgever op de hoogte gehouden. Als alles klaar is, moet de mens alleen nog even een bevestiging geven.

Een andere mogelijkheid: upload een foto van je gekrabbelde boodschappenlijstje en Operator bestelt de gewenste boodschappen bij je favoriete onlinesupermarkt. Enfin, het idee is duidelijk: de assistent moet in staat zijn om vervelende taken over te nemen.

Knoppen en menu’s

Operator wordt aangestuurd door een nieuw model, genaamd Computer-Using Agent (CUA). Dit kan omgaan met de grafische gebruikersinterfaces die mensen op hun scherm zien, zoals knoppen, menu’s en tekstvelden.

Gelijk aan de slag dan maar? Nou nee, u moet nog even geduld hebben. Operator is nog niet voor het grote publiek beschikbaar. OpenAI is berucht om onverwachte fouten en wil zijn assistent eerst voor een selecte groep beschikbaar maken.

Wie toch alvast een voorproefje wil, kan gebruikmaken van een ander nieuw stuk gereedschap van OpenAI: Tasks. Deze assistent beweegt zich nog niet autonoom over het web om bijvoorbeeld een concert te kunnen boeken, maar is al wel in staat om repeterende taken te vervullen.

Bijvoorbeeld: ‘Stuur me iedere dag om 8.00 uur een inspirerende quote van een filosoof.’ Of: ‘Geef me iedere vrijdagmiddag een samenvatting van al het nieuws van de afgelopen week op het vlak van AI.’

Uiteraard is OpenAI niet het enige AI-bedrijf dat hiermee bezig is. Concurrent Anthropic loopt bijvoorbeeld al een paar maanden warm, terwijl ook Google met zijn Gemini-app de eerste voorzichtige stappen zet in de ‘agentic era’.

Repeterend werk

Misschien nog wel meer dan voor de consumentenmarkt (reis of restaurant boeken, boodschappen doen) verwachten de AI-bedrijven hun AI-agents te kunnen inzetten in professionele omgevingen. Geen gekke gedachte, want veel taken van werknemers hebben een zowel repeterend als arbeidsintensief karakter.

Vooral Microsoft en softwarebedrijf Salesforce hebben hoge verwachtingen. De tijd van alleen maar chatten is wat hen betreft voorbij: autonome digitale werknemers zullen vanaf dit jaar echt aan de slag gaan. Agents kunnen bijvoorbeeld zelfstandig klantproblemen oplossen door de aankoopgeschiedenis en bedrijfsdocumentatie te analyseren om vervolgens gepersonaliseerd advies te geven in de tone of voice van het merk.

De hoogste baas van Salesforce, Marc Benioff, schreef vorig jaar een lijvig essay in Time Magazine over de autonome AI-werker die werk fundamenteel overhoop gaat gooien. Zijn optimistische stuk verscheen prominent op de cover. Geen onbelangrijk detail: Benioff is ook eigenaar van het blad.

Twitter bericht wordt geladen...

Hij schetst een wereld waarin AI-agents onafhankelijk naast mensen werken en allerlei taken kunnen verrichten zonder menselijke tussenkomst, van klantenservice tot voorraadbeheer.

Voor wie bang is dat er banen verdwijnen, heeft Benioff geruststellende woorden: door de ongekende productiviteitswinsten door de digitale werknemers komen er meer banen bij dan er zullen verdwijnen.

En het is wat hem betreft geen toekomstmuziek. In november vorig jaar gebruikten volgens hem al enkele honderden klanten zijn AI-agent-platform Agentforce. ‘Ons doel is om binnen een jaar een miljard agents operationeel te hebben’, aldus Benioff in een podcast van Techcrunch.

De optimistische geluiden van de grote Amerikaanse softwarebedrijven komen op een belangrijk moment. China blijkt in rap tempo alle achterstanden in AI te hebben ingelopen, met als meest in het oog lopende paradepaardje de chatbot DeepSeek. Die verbaasde vorige maand de AI-wereld door ongeveer even goed te presteren als ChatGPT, maar dan tegen een fractie van de trainingsarbeid. Met hun agents hopen de Amerikanen weer wat uit te lopen.

Bovenal moeten ze de gigantische miljardeninvesteringen van de afgelopen jaren in AI zien terug te verdienen. Investeringsbank Goldman Sachs waarschuwde vorige zomer nog dat die enorme uitgaven misschien verrassend bescheiden rendementen zouden kunnen opleveren. Maar dat was net voor de hausse aan agent-aankondigingen.

Onlinecampagne uitbesteden

Iemand die hoge verwachtingen heeft van de agents en er zelf al mee experimenteert is Maarten Mantje, marketingexpert en eigenaar van een innovatiebureau. ‘Het gereedschap is er al, bijvoorbeeld van Microsoft en Salesforce. Maar het wordt teleurstellend weinig gebruikt.’

Om ervaring op te doen bouwde Mantje een socialemedia-afdeling met agents voor een hobbyproject van hem: het Amsterdamse ginmerk Stookers. Zeven AI-agents dragen zorg voor het complete promotietraject op Instagram, van het schrijven van teksten tot het genereren van foto’s en het analyseren van de data.

‘Het heeft iets magisch, want zelf heb ik geen idee wat er wordt geplaatst.’ Het enige wat Mantje wel vooraf heeft gedaan, is wat kernwaarden meegeven, zoals ‘biologisch’ of ‘Amsterdams’.

Uiteindelijk kan de Instagrampost dan een afbeelding opleveren van een glas gin tegen de achtergrond van een Amsterdamse gracht met als begeleidende tekst: ‘Omarm de geest van Amsterdam met Stookers Gin. Ons distillatieproces met biologische ingrediënten zorgt voor een unieke en authentieke smaak.’

Een bericht gedeeld door Stookers Amsterdam (@stookers)

Het synthetisch aandoende gevoel ademt allemaal overduidelijk AI, maar dat maakt Mantje niet uit: ‘Vroeger moest je hier veel tijd aan besteden, nu helemaal niets.’ Dat het nogal gemiddeld is wat er uitkomt, en dat zijn posts nog weinig hartjes krijgen, maakt hem niet uit: ‘Het gaat me nu om het experiment.’

Dat laatste bewijst ook het gegeven dat het recept voor een van Stookers’ gins werd gegenereerd door een AI-model. Mantjes opdracht: bedenk een gin die smaakt naar de Nederlandse zomer. Wat hem betreft lukte dat uitstekend.

Menselijke rol

AI-expert Laurens Vreekamp stoeit ook al wat met agents, in zijn geval met die van Anthropic. Dit bedrijf liet zelf eind vorig jaar een voorbeeld zien van twee agents die een computer bedienen en een werkende website in jarennegentigstijl ontwierpen, precies volgens opdracht.

Ook journalisten kunnen een deel van hun taken laten overnemen door agents, zegt Vreekamp. Dat zullen vooral routinematige klussen zijn, zoals het zoeken van contactinformatie op verschillende sites en die in een spreadsheet zetten.

Het wordt spannend op het moment dat de agents meer gaan doen dan één afgebakende taak en zich een complete menselijke rol aanmeten. ‘Er kan dan meer misgaan’, zegt Vreekamp. ‘En vervolgens is het de vraag wiens verantwoordelijkheid dat is.’

Nog meer dan we gewend zijn bij chatbots komt het aan op goede prompting. Vreekamp geeft het hypothetische voorbeeld waarbij een journalist aan een agent de opdracht geeft om tien experts te bellen voor een uitzending van een actualiteitenprogramma. De agent zou een geldbedrag in het vooruitzicht kunnen stellen om iemand over te halen in de uitzending te komen, terwijl het programma dat uit principe nooit doet.

Vreekamp snijdt met dit relatief onschuldige voorbeeld een heikel punt aan waarover onderzoekers zich al langer zorgen maken: AI-modellen kunnen doelen nastreven die de opdrachtgevers eigenlijk niet voor ogen hadden. Niet voor niets vergeleek AI-onderzoeker Stuart Russell de uitdaging om het doel van een robot goed te definiëren met de mythe van koning Midas.

Midas wenste dat alles wat hij aanraakte, zou veranderen in goud. Dat gebeurde: óók zijn voedsel, drank en zelfs zijn dochter veranderden in goud. De boodschap van Russell: als je computers het verkeerde doel meegeeft, krijg je ellende. AI-modellen streven dat doel immers consequent na.

Zucht naar efficiëntie

Met de komst van autonoom opererende AI-agenten wordt dit probleem alleen maar groter, stelden onderzoekers van Apollo Research onlangs nog. Ook de Amerikaanse AI-ethicus Margaret Mitchell wijst op de risico’s: ‘Nu we steeds meer autonoom opererende agents ontwikkelen, verliezen we meer en meer menselijke controle.’

Omdat er sprake is van computerlogica (en niet van menselijke logica) kunnen we volgens haar moeilijk voorspellen wat er precies kan gebeuren, maar ze vreest voor het punt dat niet meer de mens, maar het systeem bepaalt wat er gebeurt.

Haar advies is helder: gebruik alleen systemen die mensen ondersteunen of assisteren, maar die niet de kracht hebben om menselijke beslissingen over te nemen.

Margot van der Goot, onderzoeker mens-machinecommunicatie aan de Universiteit van Amsterdam, ziet tot slot nog een ander probleem: ‘Los van de gevaren vraag ik me af of we niet ook veel verliezen in de door de AI-bedrijven gepropageerde zucht naar efficiëntie.’

‘In het werk kan ik me best wat voorstellen bij agents die delen van taken overnemen, maar privé? Het lijkt zo vanzelfsprekend dat alles om efficiëntie draait, maar van mij hoeft het plannen van een etentje of vakantie niet door AI te worden overgenomen. Je besteedt daarmee je voorpret uit.’

Alles over tech vindt u hier.

Lees ook

Geselecteerd door de redactie

Source: Volkskrant

Home