De mens laat zich graag verleiden door de laatste AI-trucjes. Ik ben geen uitzondering. Ergens in 2022 waren het de eerste plaatjesgeneratoren als Midjourney, die toen nog enthousiast afbeeldingen maakten van Picasso-achtige gezichten en handen met zes of zeven vingers.
Niet veel later was het ChatGPT die de wereld bestormde met teksten. ‘Maak een sonnet in de stijl van Shakespeare over klimaatverandering.’ En hup, daar ging-ie. Magisch. En daarna? Video en de muziekapps van Suno en Udio, waarmee iedereen zijn eigen deuntjes kon laten maken. Weet u nog? ‘Maak een liedje in de stijl van de Beatles met carnavalsinvloeden’ en de AI-programma’s deden de rest.
Ik kan ernaast zitten, maar Udio en Suno lijken bij het grote publiek niet echt te beklijven. Zou het alweer zijn uitgekeken op het circustrucje? Er zal hoe dan ook nog altijd een groep fanatieke gebruikers zijn, gezien het feit dat de twee AI-muziekdiensten op het punt staan afspraken te maken met de grote platenlabels.
Die klaagden Udio en Suno eerder aan voor het gebruik van bestaande muziek om de AI-modellen mee te trainen. Zonder die voorbeelden kunnen de apps immers niets.
Dit – nog altijd onopgeloste – auteursrechtenvraagstuk gaat ongetwijfeld ook opspelen rondom AI-video. En zo komen we op de laatste hype in AI-wonderland: video. Of liever: video mét geluid. Korte video’s maken op basis van een tekstopdracht kon al wel een tijdje met programma’s als Runway en Sora, maar Google heeft de lat een stuk hoger gelegd.
De laatste versie van Google’s text-to-videogereedschap Veo (Veo 3) voegt geluid toe aan de korte video’s. Dat is een wereld van verschil: ineens zijn de synthetische beelden nauwelijks meer te onderscheiden van echte.
Sociale media worden overspoeld met indrukwekkende voorbeelden. Soms zijn ze onschuldig, omdat het overduidelijk fictie is. Zo maken nijvere knutselaars al complete korte films met dit soort AI-software.
Problematischer wordt het als de AI-video’s realistisch en nieuws-achtig zijn, zoals de nieuwslezer die het overlijden van schrijver J.K. Rowling aankondigt of beelden van niet-bestaande rellen in Londen.
Tristan Harris, medeoprichter van het Center for Humane Technology, waarschuwt al jaren voor de manieren waarop technologie onze psyche kan manipuleren. Dat gebeurt natuurlijk al langer. Maar de overtuigingskracht van bewegend beeld is nog eens veel groter dan die van tekst of foto’s.
Realistische AI-video's met geluid vormen daarmee een nog krachtiger instrument voor beïnvloeding, misleiding en verwarring. In een wereld waarin steeds moeilijker valt uit te maken wat waar is en wat niet, dreigt het hele concept waarheid te verdwijnen.
Hoe nu verder? Te vrezen valt dat het niet bij een kortstondige hype blijft: veel meer dan muziek zijn korte video’s bij uitstek geschikt voor memes en snelle verspreiding via sociale media.
Geselecteerd door de redactie
Lees hier alle artikelen over dit thema
Source: Volkskrant columns