Een nieuwe stap in de relatie tussen mens en machine
Het begon met een simpele vraag binnen Google Research: Wat als beeldgeneratie niet langer eenrichtingsverkeer is?Tot nu toe werkte tekst-naar-beeld-AI zoals DALL-E of Imagen vooral op basis van een enkel commando: je typt iets in, en de machine probeert het zo goed mogelijk te visualiseren. Maar die methode bleek vaak frustrerend — het resultaat is zelden precies wat de gebruiker bedoelde.
Onderzoekers bij Google besloten dat het anders moest. Ze wilden een model dat niet slechts uitvoert, maar meedenkt, leert en aanpast. Zo ontstond PASTA, een nieuwe AI-agent die samen met de gebruiker op ontdekkingstocht gaat om het perfecte beeld te creëren.
|
A collaborative approach to image generationWe introduce PASTA, a reinforcement learning agent that refines text-to-image output over multiple turns of interaction with a user by learning their unique preferences. This process is made possible by a novel user simulation technique. |
Van commando naar conversatie
De traditionele manier van beeldgeneratie voelt wat houterig: de gebruiker schrijft een prompt, de AI genereert een beeld, en de cyclus herhaalt zich eindeloos. Maar echte creativiteit ontstaat zelden in één poging. Ze groeit in dialoog, in nuance, in kleine aanpassingen.
Daarom werd PASTA ontworpen als een samenwerkende partner. De gebruiker geeft niet één lange instructie, maar gaat een reeks gesprekken aan met het systeem. De AI leert bij elke stap beter begrijpen wat de gebruiker bedoelt — of dat nu een bepaalde sfeer, kleur, of compositie is.
Het resultaat? Een veel natuurlijker, menselijker proces van visuele creatie.
De uitdaging: Hoe leer je een AI om voorkeuren te begrijpen?
Een AI die voorkeuren leert, heeft enorme hoeveelheden data nodig — liefst data over hoe echte mensen reageren op beelden. Maar zulke gegevens zijn zeldzaam én gevoelig. Daarom bedacht het onderzoeksteam een slimme tweefasenaanpak.
In de eerste fase verzamelden ze echte interacties van meer dan 7.000 menselijke beoordelaars. Die mensen voerden sequentiële gesprekken met het model: ze verfijnden prompts, kozen tussen varianten en gaven feedback.
In de tweede fase gebruikte Google deze gegevens om een virtuele gebruiker te bouwen: een simulator die menselijke keuzes kan nabootsen. Dankzij die digitale “testpersoon” kon de AI op grote schaal trainen zonder dat echte gebruikers telkens opnieuw moesten meedoen.
Onder de motorkap: De smaak van de gebruiker voorspellen
PASTA werkt met een intern gebruiksmodel dat de persoonlijke smaak van de gebruiker probeert te voorspellen. Dat model bestaat uit twee delen:
- Het ‘utility-model’ schat in hoe aantrekkelijk een bepaald beeld voor iemand zal zijn.
- Het ‘choice-model’ probeert te voorspellen welk beeld de gebruiker daadwerkelijk zou kiezen.
Beide onderdelen zijn gebouwd op basis van Google’s krachtige CLIP-encoders, die beelden en tekst op semantisch niveau begrijpen. Maar PASTA voegt er iets extra’s aan toe: het leert hoe jij persoonlijk reageert — jouw voorkeur voor lichte of donkere tinten, realistisch of abstract, rustig of dynamisch.
De resultaten: Beter, consistenter, menselijker
Toen PASTA werd getest tegen bestaande beeldmodellen, gebeurde er iets opvallends: gebruikers kozen steeds opnieuw de PASTA-beelden als favoriet.Niet omdat ze altijd perfect waren, maar omdat ze dichter bij hun intentie lagen.
De samenwerking – mens geeft richting, AI past zich aan – bleek krachtiger dan eenrichtingsprompting. De machine werd als het ware een visuele sparringpartner.
De grotere betekenis: Van tool naar teamgenoot
Wat Google hier introduceert, is meer dan een technische verbetering. Het is een filosofische verschuiving in hoe we met AI omgaan.
In plaats van een hulpmiddel dat uitvoert wat je zegt, wordt AI een co-creator — een digitale partner die meedenkt, nuance aanbrengt, en leert van je smaak.Het is een toekomstbeeld waarin technologie niet onze creatieve intuïtie vervangt, maar juist versterkt.
Een blik vooruit: Creatieve AI die luistert
De onderzoekers zien PASTA niet als eindpunt, maar als begin van een nieuw tijdperk.Ze dromen van creatieve systemen die met muzikanten, ontwerpers of schrijvers in dialoog kunnen gaan — die niet enkel commando’s volgen, maar samenwerken, reflecteren en verbeteren.
Beeldgeneratie wordt zo niet langer een algoritmisch proces, maar een gesprek tussen mens en machine.En misschien is dát precies de stap die kunstmatige intelligentie menselijker maakt.









