ChatGPT is nog altijd het populairste AI-gereedschap, ook onder Nederlanders. Maar er is veel meer. Een overzicht van de leukste (en soms ook handige) AI-tools.
Het is nog maar twee jaar geleden dat generatieve AI het grote publiek bereikte. Eerst voorzichtig, via afbeeldingenmakers Dall-E en Midjourney, waarna ChatGPT een dijkdoorbraak veroorzaakte. Deze chatbot bereikte binnen twee maanden honderd miljoen gebruikers.
Elke dag komen er nieuwe AI-programmaatjes en -apps bij. Het kan lastig zijn door de bomen het bos te zien. Vandaar dit overzicht van het leukste en beste gereedschap.
Een belangrijke disclaimer: ook al zijn veel programma’s gratis te gebruiken, hun inzet komt met een prijs. AI kan indrukwekkende teksten, beelden of muziek genereren, maar alleen dankzij het gebruik van een grote hoeveelheid trainingsmateriaal, waarvoor in veel gevallen nooit toestemming is gegeven. Ook kost het genereren van al dat moois gigantisch veel energie.
Over de auteur
Laurens Verhagen is wetenschapsredacteur van de Volkskrant. Hij schrijft over technologie en de impact van kunstmatige intelligentie op de maatschappij.
Video is de grote hype in de wereld van generatieve AI. Die begon een paar maanden terug met de introductie van Sora van OpenAI. Wat de maker van ChatGPT begin dit jaar liet zien aan voorbeeldvideo’s was bijzonder indrukwekkend. Onlangs maakte Toys R Us zelfs een complete commercial met Sora.
Twitter bericht wordt geladen...
Eén probleem: bijna niemand kan Sora nog gebruiken. Maar er zijn andere programma die video’s kunnen maken op basis van een simpele tekstopdracht.
De interessantste zijn Gen-3 Alpha van Runway en Dream Machine van Luma Labs. Runway timmert al wat langer aan de weg met text-to-video, maar de laatste versie heeft enorme stappen gemaakt, met als resultaat veel realistischere videootjes dan de vorige versie.
Het gebruik is simpel: geef een tekstopdracht en het programma doet de rest. Neem hierbij wel de lessen in acht die we eerder bij Dall-E en Midjourney leerden: hoe specifieker de tekstopdracht (prompt), hoe beter het resultaat. Zeg bijvoorbeeld niet ‘Maya-figuur op een piramide’, maar ‘360 graden cirkelshot van een Maya-figuur op een piramide in de jungle, zonsondergang’.
Twitter bericht wordt geladen...
Concurrent Luma Labs werkt ongeveer hetzelfde en heeft daarnaast een erg leuke extra in de vorm van een begin- en eindfoto die je kan meegeven. Luna vult de ontbrekende seconden in (zowel Luna als Runway maakt filmpjes van maximaal tien seconden) en laat de twee foto’s soepel in elkaar overlopen. Is dat nuttig? In het geheel niet, maar het is wel superleuk om te doen.
Twitter bericht wordt geladen...
Wie Gen-3 Alpha van Runway wil gebruiken, moet een abonnement nemen. Een eerdere versie is wel gratis. Dream Machine van Luma Labs is (met beperkingen) zonder abonnement te gebruiken.
Midjourney en Dall-E hebben er ineens een geduchte concurrent bij: Flux. Dit AI-programma komt uit de koker van de jonge start-up Black Forest. Deze kreeg onlangs wereldwijde bekendheid via Elon Musk: betalende klanten van zijn chatbot Grok kunnen sinds kort afbeeldingen maken waarbij ze op de achtergrond gebruikmaken van Flux.
In de basis werkt Flux hetzelfde als bij Midjourney en Dall-E: geef een prompt en het programma komt even later met de gevraagde afbeeldingen. Toch is er een groot en principieel verschil. Anders dan de concurrenten heeft Flux nauwelijks beperkingen. Wie bijvoorbeeld een afbeelding wil van Donald Trump met een geweer, kan gewoon bij dit programma terecht, wat critici de wenkbrauwen doet fronsen.
Twitter bericht wordt geladen...
Flux is gratis.
Over ElevenLabs schreven we al vaker. Het bedrijf geldt als dé specialist op het gebied van synthetische stemmen. Met zijn technologie kan iedereen teksten omzetten in een stem, maar ook een kopie van de eigen stem of die van iemand anders maken. Het nieuwste is de aparte app Reader, die speciaal is bedoeld voor het voorlezen van teksten.
In de app zitten duizenden stemmen, dus voor ieder wat wils. Er zijn ook een paar iconische stemmen van overleden beroemdheden, zoals James Dean, Judy Garland of Burt Reynolds. Vervolgens kunnen deze stemmen alles voorlezen wat je naar de app uploadt. Dat kunnen boeken zijn, losse teksten of nieuwsberichten. Bij dat laatste is het invoeren van een webadres voldoende.
Beperking: vooralsnog zijn er alleen Engelse stemmen. Het voorlezen van een Volkskrant-artikel zit er nog niet in, maar Elevenlabs belooft snelle uitbreiding naar andere talen. Ook een Android-versie volgt.
De eerste drie maanden is Reader gratis.
ChatGPT is met afstand de bekendste chatapp, maar er zijn er veel meer. De bekendste daarvan zijn Gemini van Google, Claude van Anthropic en Llama van Meta. Wie de verschillen zelf eenvoudig wil ervaren, kan de app Poe proberen. Hierin zitten al deze bots en ook nog in verschillende versies. Ook verzamelt Poe veel gespecialiseerde bots, zoals een ‘wiskundeleraar’, een programmeerhulp, relatietherapeut of een trolbot.
Poe beperkt zich niet tot teksten en biedt ook een groot aantal afbeeldingen-generatoren. De bekendste is Stable Diffusion, maar ook Flux zit er al in.
Basisgebruik van Poe is gratis, maar er zijn ook betaalde varianten van bots.
Geen zin in die overvloed? Probeer dan Claude van Anthropic. Deze chatbot presteert minstens zo indrukwekkend als ChatGPT en kent daarnaast nog interessante extra trucjes. Met Artifacts kan iedereen zelf iets programmeren. Of liever: Claude doet dat. Het enige wat de gebruiker hoeft te doen, is het invoeren van een prompt. Daarna maakt Claude een quiz, een game of een complete website.
Het aardige is dat je het resultaat direct op je scherm ziet, zodat je de uitkomst eenvoudig kunt aanpassen. Nog leuker: je kunt ook voortborduren op andermans inspanningen of je eigen creaties delen. Tevreden? Gebruik de code die Claude heeft gegenereerd.
Een andere leuke optie van Anthropic is de ‘promptgenerator’. Deze helpt bij het maken van betere prompts, bijvoorbeeld voor het schrijven van antwoorden in e-mails.
Claude (inclusief Artifacts) is gratis, de promptgenerator niet.
De twee bekendste programma’s voor het maken van muziek met AI zijn Suno en Udio. De Volkskrant constateerde al eerder dat hun creaties inmiddels erg indrukwekkend zijn. Een interessante nieuwe toevoeging is de mogelijkheid geluid te uploaden, waarna de AI aan de hand daarvan een liedje maakt in combinatie met een tekstopdracht.
Dat kan van alles zijn: een geluidsfragment uit een favoriete film (‘I am sorry Dave, I am afraid I can’t do that’), een drumroffeltje op het autostuur, een gefloten deuntje of een gitaarrifje.
Er is veel kritiek op Udio en Suno omdat ze in sommige gevallen liedjes genereren die als twee druppels water lijken op de originelen waarmee hun modellen zijn getraind, maar deze nieuwe audio-uploads brengen wellicht wat nieuwe creatieve mogelijkheden.
Zoals altijd met AI is het resultaat wel afhankelijk van goede prompts én een kwestie van geduld en blijven proberen.
Bij Suno zit de audio-upload in de gratis versie, bij Udio is dat niet het geval. Wie daar deze nieuwe mogelijkheid wil proberen, kan echter wel terecht bij een tijdelijke gratis proefperiode voor de betaalvariant.
Wie Photoshop gebruikt, kent deze AI-truc misschien al langer: breid een foto uit. AI maakt een foto veel groter door het gebied om het oorspronkelijke plaatje erbij te ‘verzinnen’.
Wie op een laagdrempelige manier zelf met deze mogelijkheid aan de slag wil gaan, kan bijvoorbeeld terecht bij Freepik Pikaso. Een kind kan de was doen: upload de foto, vertel wat je wilt zien in de op te vullen ruimte en het programma doet de rest.
Dezelfde site biedt nog meer leuks, zoals het vertalen van een schets naar een foto of het scherper maken van vage afbeeldingen. Dat laatste zit tegenwoordig trouwens ook in Google Photo, naast bijvoorbeeld de ‘magische gum’ om ongewenste objecten op Stalin-achtige wijze weg te gummen.
Let wel op: wie probeert met Freepik Picasso wat ongewone foto’s scherp te krijgen (zoals de iconische foto van een wezel die een ritje maakt op de rug van een specht), kan bedrogen uitkomen. De AI kan in zijn enthousiasme een wel heel vrije interpretatie geven.
Freepik Pikaso is gratis, maar met de nodige beperkingen.
Tot slot een programma dat, meer dan alle andere hierboven, nuttig is. De chatbots van Google, OpenAI en al die andere bedrijven hebben één fundamentele beperking: ze kunnen nog weleens onzin praten. ‘Hallucineren’, noemen de AI-bedrijven dat zelf graag, maar dat is te veel eer.
Google heeft een zeer interessant nieuw product (NotebookLM) dat dit probleem grotendeels lijkt op te lossen, al zegt het bedrijf er voor de zekerheid bij dat chatbots ‘soms nog steeds onjuiste antwoorden geven’.
ChatGPT en Gemini zijn gevoed met ontelbare (betrouwbare en minder betrouwbare) bronnen en halen daar hun informatie vandaan. En soms verzinnen ze gewoon wat. NotebookLM heeft een radicale aanpak: het baseert zich puur en alleen op de documenten die de gebruiker uploadt.
Per ‘aantekenboek’ kun je tot maximaal vijftig bronnen toevoegen, zoals tekstbestanden of pdf’s. Die bestanden kunnen behoorlijk groot zijn: tot maar liefst 500 duizend woorden. NotebookLM beperkt zich vervolgens tot alleen deze bestanden.
Wie bijvoorbeeld dertig wetenschappelijke studies over klimaatverandering invoert, krijgt van het programma daar antwoorden over. Het programma kan ook razendsnel verschillen tussen de diverse bronnen uitlichten, of juist zijn licht laten schijnen op interessante overeenkomsten. Het fijne is ook dat NotebookLM bij elke uitspraak linkt naar de pagina van de oorspronkelijke tekst waar het zijn informatie vandaan haalt.
Belangrijk, want ook hier blijft controle belangrijk. Het wachten is nu op de mogelijkheid ook audio of video toe te voegen.
NotebookLM is gratis.
Geselecteerd door de redactie
Source: Volkskrant