Van prompt naar gesprek: Google AI aanpak voor beeldgeneratie

Van prompt naar gesprek: Google AI aanpak voor beeldgeneratie

Een nieuwe stap in de relatie tussen mens en machine

Het begon met een simpele vraag binnen Google Research: Wat als beeldgeneratie niet langer eenrichtingsverkeer is?Tot nu toe werkte tekst-naar-beeld-AI zoals DALL-E of Imagen vooral op basis van een enkel commando: je typt iets in, en de machine probeert het zo goed mogelijk te visualiseren. Maar die methode bleek vaak frustrerend — het resultaat is zelden precies wat de gebruiker bedoelde.

Onderzoekers bij Google besloten dat het anders moest. Ze wilden een model dat niet slechts uitvoert, maar meedenkt, leert en aanpast. Zo ontstond PASTA, een nieuwe AI-agent die samen met de gebruiker op ontdekkingstocht gaat om het perfecte beeld te creëren.

A collaborative approach to image generation

A collaborative approach to image generation

We introduce PASTA, a reinforcement learning agent that refines text-to-image output over multiple turns of interaction with a user by learning their unique preferences. This process is made possible by a novel user simulation technique.

https://research.google

Van commando naar conversatie

De traditionele manier van beeldgeneratie voelt wat houterig: de gebruiker schrijft een prompt, de AI genereert een beeld, en de cyclus herhaalt zich eindeloos. Maar echte creativiteit ontstaat zelden in één poging. Ze groeit in dialoog, in nuance, in kleine aanpassingen.

Daarom werd PASTA ontworpen als een samenwerkende partner. De gebruiker geeft niet één lange instructie, maar gaat een reeks gesprekken aan met het systeem. De AI leert bij elke stap beter begrijpen wat de gebruiker bedoelt — of dat nu een bepaalde sfeer, kleur, of compositie is.

Het resultaat? Een veel natuurlijker, menselijker proces van visuele creatie.

De uitdaging: Hoe leer je een AI om voorkeuren te begrijpen?

Een AI die voorkeuren leert, heeft enorme hoeveelheden data nodig — liefst data over hoe echte mensen reageren op beelden. Maar zulke gegevens zijn zeldzaam én gevoelig. Daarom bedacht het onderzoeksteam een slimme tweefasenaanpak.

In de eerste fase verzamelden ze echte interacties van meer dan 7.000 menselijke beoordelaars. Die mensen voerden sequentiële gesprekken met het model: ze verfijnden prompts, kozen tussen varianten en gaven feedback.

In de tweede fase gebruikte Google deze gegevens om een virtuele gebruiker te bouwen: een simulator die menselijke keuzes kan nabootsen. Dankzij die digitale “testpersoon” kon de AI op grote schaal trainen zonder dat echte gebruikers telkens opnieuw moesten meedoen.

Onder de motorkap: De smaak van de gebruiker voorspellen

PASTA werkt met een intern gebruiksmodel dat de persoonlijke smaak van de gebruiker probeert te voorspellen. Dat model bestaat uit twee delen:

  1. Het ‘utility-model’ schat in hoe aantrekkelijk een bepaald beeld voor iemand zal zijn.
  2. Het ‘choice-model’ probeert te voorspellen welk beeld de gebruiker daadwerkelijk zou kiezen.

Beide onderdelen zijn gebouwd op basis van Google’s krachtige CLIP-encoders, die beelden en tekst op semantisch niveau begrijpen. Maar PASTA voegt er iets extra’s aan toe: het leert hoe jij persoonlijk reageert — jouw voorkeur voor lichte of donkere tinten, realistisch of abstract, rustig of dynamisch.

De resultaten: Beter, consistenter, menselijker

Toen PASTA werd getest tegen bestaande beeldmodellen, gebeurde er iets opvallends: gebruikers kozen steeds opnieuw de PASTA-beelden als favoriet.Niet omdat ze altijd perfect waren, maar omdat ze dichter bij hun intentie lagen.

De samenwerking – mens geeft richting, AI past zich aan – bleek krachtiger dan eenrichtingsprompting. De machine werd als het ware een visuele sparringpartner.

De grotere betekenis: Van tool naar teamgenoot

Wat Google hier introduceert, is meer dan een technische verbetering. Het is een filosofische verschuiving in hoe we met AI omgaan.

In plaats van een hulpmiddel dat uitvoert wat je zegt, wordt AI een co-creator — een digitale partner die meedenkt, nuance aanbrengt, en leert van je smaak.Het is een toekomstbeeld waarin technologie niet onze creatieve intuïtie vervangt, maar juist versterkt.


Een blik vooruit: Creatieve AI die luistert

De onderzoekers zien PASTA niet als eindpunt, maar als begin van een nieuw tijdperk.Ze dromen van creatieve systemen die met muzikanten, ontwerpers of schrijvers in dialoog kunnen gaan — die niet enkel commando’s volgen, maar samenwerken, reflecteren en verbeteren.

Beeldgeneratie wordt zo niet langer een algoritmisch proces, maar een gesprek tussen mens en machine.En misschien is dát precies de stap die kunstmatige intelligentie menselijker maakt.

Aanbevolen voor jou

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een UP-TO-DATE AI Website 100% in Google

Een UP-TO-DATE AI Website maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak