DeepMind toont hoe AI omgevingen real-time en interactief bouwt
DeepMind heeft woensdag officieel Genie 3 gepresenteerd, een gloednieuw wereldmodel dat interactieve 3D-omgevingen genereert op basis van tekstprompts. In tegenstelling tot eerdere modellen zijn deze werelden navigeerbaar in real time, met consistentie over meerdere minuten, op 720p-resolutie en 24 frames per seconde.
Van video naar spelwereld: Wat is Genie 3?
Genie 3 is de derde iteratie in DeepMind’s Genie-reeks. Waar eerdere versies vooral kort durende clips konden produceren, stimuleert Genie 3 gebruikers om zelf actief te bewegen in de gegenereerde wereld. De omgeving onthoudt je interacties, zodat je bij terugkeren nog steeds dezelfde objecten, stormwolken of gebouwen terugziet.
Wat maakt Genie 3 uniek?
- Realtime interactiviteit – je beweegt, de wereld past zich onmiddellijk aan zonder haperingen.
- Visueel geheugen – objecten blijven consistent zichtbaar, zelfs na beweging door de wereld.
- Promptgestuurde wereldgebeurtenissen – je kunt mid-simulatie tekstcommando’s geven zoals “laat het regenen” of “voeg een gorilla toe”, en dit wordt direct uitgevoerd.
- Geen vooraf gedefinieerde geometrie – elk beeldframe wordt dynamisch gegenereerd zonder afhankelijk te zijn van vooraf gemaakte 3D-structuren zoals bij NeRF of Gaussian Splatting.
Toepassingsmogelijkheden
- Agenttraining en robotica: AI-agenten kunnen complexe taken uitvoeren, leren van oorzaak-gevolg in een veilige virtuele omgeving.
- Onderwijs en cultuurhistorie: Denk aan wandelingen door het oude Athene of reconstructies van paleizen zoals Knossos.
- Creatieve media: Animaties, games en films zonder omvangrijke productieteams of game-ontwikkelingsexpertise.
Grenzen en aandachtspunten
DeepMind wijst op een aantal belangrijke beperkingen van Genie 3:
- Beperkte actieruimte voor de agent zelf – de meeste scenario-aanpassingen vinden plaats via tekstprompts, niet uit autonome agentacties.
- Moeilijkheden bij sociale en multi-agent interacties – samenwerken tussen meerdere entiteiten valt buiten het huidige bereik.
- Geen perfecte geografische nauwkeurigheid – echte locaties kunnen nog niet feilloos worden gereconstrueerd.
- Tekstweergave is fragiel – leesbare tekst verschijnt vaak alleen als die expliciet in de prompt is opgenomen.
- Beperkte duur van interactie – enkele minuten per sessie, niet meerdere uren.
De schakel naar AGI
Volgens DeepMind speelt Genie 3 een cruciale rol op de weg naar kunstmatige algemene intelligentie (AGI). Het model creëert generieke, schaalbare simulaties waarin AI-agenten zich kunnen ontwikkelen en beslissingen kunnen leren begrijpen op basis van oorzaak, effect en planning. Experts benadrukken dat juist deze vorm van fysiek redeneren in virtuele omgevingen essentieel is voor de volgende stap in AI‑ontwikkeling.
Veiligheid eerst: Verantwoordelijk ontwikkelen
Genie 3 wordt als beperkte onderzoeksversie uitgebracht, exclusief beschikbaar voor een kleine groep academici en makers. Die benadering moet ruimte bieden voor zorgvuldig onderzoek naar risico’s en ethiek voorafgaand aan bredere beschikbaarheid.
Blik op de toekomst
DeepMind overweegt om uit te breiden naar een grotere testgroep. Mogelijke toekomstige toepassingen liggen niet alleen in robotica en opleiding, maar ook in immersieve leeromgevingen en interactieve media, waar deze modelwerelden echt tot leven komen.
Conclusie
Genie 3 markeert een doorbraak: Van statische video’s naar werelden die je écht kunt beleven, navigeren en beïnvloeden. Hoewel het nog geen kant-en-klaar platform is voor consumenten, biedt het model een kijkje in een toekomst waar AI-agenten leren en experimenteren in rijke, gesimuleerde werelden. Dit kan een fundamentele stap zijn richting robots en algoritmen met een dieper begrip van de fysieke werkelijkheid – een belangrijke mijlpaal op de weg naar echt algemene intelligentie.
|
Genie 3: A New Frontier for World ModelsToday we are announcing Genie 3, a general purpose world model that can generate an unprecedented diversity of interactive environments. Given a text prompt, Genie 3 can generate dynamic worlds... |









