Wat is kunstmatige intelligentie? En: wat kun je ermee?

N.B. Het kan zijn dat elementen ontbreken aan deze printversie.

Kunstmatige ofwel artificiële intelligentie (AI) is een term die we lang associeerden met sciencefictionfilms en futuristische robots. En toen kwam in november 2022 ChatGPT: een chatbot die hele gesprekken met je kan hebben en je op vele manieren kan helpen, gratis voor iedereen toegankelijk.

Met de nieuwe AI-modellen kun je teksten schrijven, nepfoto’s maken van bekende mensen, games programmeren of binnen een paar seconden een lijst met perfecte balkonplanten voor jouw flat opstellen. Opeens lijkt kunstmatige intelligentie een technologie die onze hele samenleving in de war kan gooien: raken we straks onze banen kwijt aan AI? Ofwel: moeten we bang zijn voor kunstmatige intelligentie?

Maar kunstmatige intelligentie biedt ook kansen. Wat kunnen we er zelf mee, en hoe werkt het als we aan ChatGPT vragen om iets te schrijven? Met deze gids poogt NRC de belangrijkste praktische vragen rond AI te beantwoorden. Dat blijft een proces: met nieuwe inzichten en toepassingen zal deze gids ook weer vernieuwd worden. Maar hopelijk biedt die voor nu sowieso alvast een handvat om deze complexe, veelomvattende technologie beter te plaatsen, te begrijpen, en te gebruiken.

NRC AI

Nieuwsbrief over de nieuwste ontwikkelingen op AI-gebied

Ga naar een onderdeel naar keuze:

Kunstmatige of artificiële intelligentie (AI) is in brede zin: een intelligent systeem dat door mensen ontworpen is. Maar over wat ‘intelligentie’ precies betekent, zijn de meningen verdeeld. Is een schaakcomputer die heel goed kan schaken intelligent? Of juist dom, omdat-ie verder niks anders kan?

In de praktijk wordt er doorgaans over AI gesproken als het gaat om systemen waarbij een computer min of meer zelfstandig data kan analyseren en tot conclusies kan komen op basis van die data. In feite zijn de algoritmen die sociale mediaplatformen gebruiken om te beslissen welke berichten jij ziet ook al rudimentaire kunstmatige intelligentie. Ze analyseren zelfstandig berichten en bepalen waar de gevonden video’s of teksten over gaan. Daarna besluiten ze welke berichten de scroller waarschijnlijk zal willen zien, op basis van een complexe rekenkundige formule.

Vaak wordt een deel van deze formule nog handmatig door een mens bedacht en bepaald, maar zogenoemde ‘machine learning’-systemen worden daarbij steeds belangrijker. Deze systemen ‘leren’ zichzelf aan welke formules ze moeten toepassen.

Er zijn verschillende manieren om kunstmatige intelligentie te ontwikkelen. Op dit moment is machine learning de meest prominente: hierbij wordt een computersysteem zo opgezet dat het patronen ‘leert’ te vinden in grote hoeveelheden data en op basis daarvan nieuwe data kan verwerken of aanmaken.

Dat begint met een trainingsfase, waarbij het systeem veel informatie krijgt om te bestuderen. Denk bijvoorbeeld aan vogelfoto’s uit een beeldbank, met bijbehorende namen. Bij het ‘zien’ van elke foto stelt het systeem zichzelf bij: komt dit stukje beeld vaker voor? Waar wordt het mee geassocieerd? Is er een naam voor? Uiteindelijk levert dit een model op, een programma dat vogels op nieuwe foto’s kan herkennen. Aan dat model kunnen mensen dan weer vragen stellen over hun eigen foto’s.

Simpel gezegd is een generatieve AI een programma dat niet alleen beelden of teksten kan herkennen, maar ook zelf nieuwe beelden en/of teksten kan aanmaken. Denk aan chatbots als ChatGPT of Bard, maar ook aan beeldmodellen als Midjourney of Dall-E. In het geval van AI die zelf teksten maakt, spreken we doorgaans van Large Language Models (LLM), een bepaalde vorm van generatieve intelligentie die getraind is op een grote database met teksten.

Het gaat in alle gevallen om artificiële intelligentie die geleerd heeft om patronen te herkennen en te reproduceren. Denk aan hoe je telefoon kan ‘voorspellen’ welk woord jij aan het tikken bent: dat kan omdat de software weet welke letters het meest frequent volgen op de letters die jij al hebt ingevoerd. Een taal- of beeldmodel doet in feite hetzelfde, alleen heeft die veel meer bronmateriaal en kan het daarom accurater voorspellingen doen.

Hoe die trainingen precies plaatsvinden, is complex. Het kost veel energie en de koeling van betrokken computers vereist veel watergebruik. Een populaire leertechniek voor beeldmodellen is diffusie. Dat houdt in dat het systeem een afbeelding vervaagt totdat er alleen een wolk van verkleurde pixels ontstaat. Daarna probeert het systeem deze wolk weer terug te veranderen in de oude afbeelding. Daaruit kan het systeem leren hoe logisch het is dat een bepaalde pixel naast een andere pixel staat.

Om zo’n netwerk te trainen is ongelooflijk veel materiaal nodig, anders kunnen de nodige verbindingen niet gelegd worden. Maar wat voor materiaal er precies achter taalmodellen als ChatGPT zit, is lastig te beoordelen.

Voor ChatGPT waren miljarden woorden nodig. Daarom gebruikte eigenaar OpenAI waarschijnlijk onder andere de zogenoemde ‘Common Crawl’-database. Dit is een enorme verzameling van webpagina’s en boeken die sinds 2018 online beschikbaar zijn. De database is door iedereen gratis te downloaden. Maar Common Crawl is vooral berekend op wetenschappelijk onderzoek en ander niet-commercieel gebruik: er zit veel auteursrechtelijk beschermd materiaal in. Het is niet duidelijk of daar iets van verwijderd is bij het trainen van het taalmodel. En daarnaast heeft OpenAI waarschijnlijk nog veel meer data gebruikt, waarvan we weinig afweten.

Bij beeldmodellen leidt dit nu al tot controverse. Zo wordt Stability AI, het bedrijf achter beeldmodel Stable Diffusion, aangeklaagd door Getty Images omdat het watermerk van Getty duidelijk op gegenereerde beelden te zien is. Daarom weet Getty zeker dat Stability AI ook beschermd materiaal uit de Getty-beeldbank heeft gebruikt om het model te trainen.

De mensheid dagdroomt al heel lang over het bouwen van apparaten die zelf kunnen denken. Denk maar aan Frankenstein van Mary Shelley, dat in 1818 gepubliceerd werd (en in 1931 verfilmd): een wetenschapper bouwt een zelfbewust wezen uit dode lichaamsdelen.

De eerste concrete stappen naar een kunstmatig intelligente computer werden zo rond de jaren vijftig van de vorige eeuw gemaakt. De Britse computerkundige Arthur Samuel bouwde in 1952 het eerste programma dat kon dammen. Slechts drie jaar later werd de uitdrukking ‘artificiële intelligentie’ voor het eerst openbaar gebruikt. Maar pas toen de Deep Blue-schaakcomputer in 1996 schaakkampioen Garry Kasparov wist te verslaan, kwam AI echt in de publieke belangstelling te staan.

Heel Silicon Valley staat inmiddels bol van de kleine en grote techbedrijven die ‘iets’ met artificiële intelligentie willen doen. Ze zetten veel in op generatieve AI, omdat dat vrij breed inzetbaar is. De meeste bedrijven werken daarbij met andermans beeld- of taalmodel. Wie de middelen heeft om er zelf een samen te stellen, heeft dus potentieel veel macht.

Van die partijen maakte OpenAI de meeste furore, nadat de organisatie vorig jaar taalmodel ChatGPT en beeldmodel Dall-E beschikbaar stelden aan het grote publiek. Dit bedrijf begon als een non-profitstichting, opgericht door miljardairs als Elon Musk (Tesla), Peter Thiel (PayPal) en Sam Altman, maar werd door de jaren heen steeds commerciëler. Microsoft investeerde miljarden dollars in OpenAI en maakt gebruik van ChatGPT voor de AI-versie van zijn Bing-zoekmachine.

Een aantal grote techbedrijven werkt aan, of heeft al, taalmodellen die op GPT lijken. Google heeft net een eigen chatbot gelanceerd: Bard, op basis van zijn GPT-concurrent LaMDA. De Chinese zoekmachine Baidu heeft een eigen chatbot, ERNIE. Meta, het moederbedrijf van Facebook, werkt aan zijn LLaMa-model. LLaMa is open source, wat betekent dat anderen de technologie kunnen inzien en gebruiken om hun eigen taalmodellen te trainen.

De Chinese techgigant Alibaba kondigde in april Tongyi Qianwen aan, kunstmatige intelligentie die onderdeel wordt van zijn zakelijke chatplatform. Daarnaast werken ook kleinere bedrijven als hardwarefabrikant Nvidia aan eigen taalmodellen. Stable Diffusion en Midjourney zijn de voornaamste beeldmodellen en in handen van onafhankelijke bedrijven.

NRC maakt op de redactie ook gebruik van kunstmatige intelligentie. „Zo gebruiken onze journalisten sinds dit jaar een transcriptietool om hun opnames uit te werken gebaseerd op Whisper, de spraakherk Source: NRC

Home

Wat is kunstmatige intelligentie? En: wat kun je ermee?