In de wereld van kunstmatige intelligentie staat een nieuw terrein op het punt door te breken: zogenaamde wereldmodellen (world models). Deze benadering, waarin AI-systemen leren om ruimtelijke en fysieke omgevingen te begrijpen zoals mensen dat doen, wordt door kenners gezien als de volgende grote stap na de grote taalmodellen. Een start-up die daarin bijzonder opvalt is General Intuition, opgericht door Pim de Witte, met data afkomstig van het gameplatform Medal.
Why world models are the next big thing in AIA new startup called General Intuition is part of a growing wave of companies trying to make AI agents that can interact with the real world. |
Speldata als goudmijn voor AI
In “het midden van vorig jaar” begon Pim de Witte contact te leggen met vooraanstaande AI-labs, met de vraag of zij interesse hadden in de enorme hoeveelheid gameclip-data die Medal verzamelt – ongeveer 2 miljard uploads per jaar vanuit tienduizenden spellen. Het viel hem op dat meerdere labs zeer snel acquisitie- aanbiedingen deden — wat hem duidelijk maakte dat deze data wel degelijk “meer bleek te zijn dan wat we dachten dat we hadden”.
Hij had de publicatie gezien van DeepMind (onderdeel van Google) waaruit bleek dat game-data gebruikt kon worden om AI te trainen in navigatie in een 3D-omgeving. Vanuit die gedachte ontstond General Intuition, met seed-kapitaal van circa 133,7 miljoen USD, geleid door investeerder Vinod Khosla, die dit ziet als een soortgelijke kans als wat hij zag bij de oprichting van OpenAI.
Wat zijn wereldmodellen precies?
Terwijl grote taalmodellen (LLM’s) zoals GPT‑4 en andere systemen vooral tekstuele patronen leren — en dus vooral georiënteerd zijn op taal en symbolische manipulatie — richten wereldmodellen zich op het begrijpen van ruimte, tijd, fysieke relaties en acties. Metallisation zoals “een robot weet dat een glas zal omvallen als je het omstoot” illustreren de ambitie.
In concrete termen: wereldmodellen trachten te leren wat er zal gebeuren als je actie A neemt in situatie B — iets wat verder gaat dan “welke zin komt hierna” maar eerder “welke fysieke reactie volgt”.
Top AI researchers say language is limiting. Here's the new kind of model they are building instead.Top AI researchers like Fei-Fei Li and Yann LeCun are developing a "world" model that doesn't rely solely on language. |
Waarom nu? En waarom gaming-data?
Er zijn verschillende redenen waarom dit het juiste moment is voor wereldmodellen:
- Gaming-omgevingen bieden gecontroleerde, maar complexe fysieke/spatiële uitdagingen: acties hebben duidelijke gevolgen, feedback is direct. De Witte: “Games zijn eigenlijk de enige verifieerbare domeinen voor ruimte-tijd redenatie” – je kunt goed vs. slecht verschil maken in één klik.
- De AI-industrie zoekt nieuwe terrein na de explosie van tekst-gebaseerde modellen — de vooruitgang in taal is indrukwekkend, maar toont ook grenzen: zonder fysieke ervaring blijft er iets achter. Wereldmodellen beloven die stap te maken.
- Datavoorziening: Medal’s bulk gameclips vormen een unieke dataset die men zelden vindt in traditionele AI-training (randgevallen, interactie in 3D, menselijke spelers, etc.).
Beyond Chatbots: Why World Models Are AI's Real Next ActTech giants pour billions into world models—AI systems that understand 3D space and physics like humans. It's inevitable, but the timing reveals Silicon Valley's desperate search for the next breakthrough. |
De inzet & potentie
General Intuition wil niet beperkt blijven tot spelletjes. Hun ambitie: modellen die apparaten aansturen met controller- of muis/keyboard-inputs — denk aan: zoek- en reddingsdrones, humanoïde robots, zelfrijdende auto’s.
Investeerders zien dit als mogelijk de volgende grote infrastructuur in AI: “Meerdere bedrijven van honderden miljarden, misschien zelfs biljoenen dollar, zullen hier gebouwd worden.” aldus Khosla.
Risico’s & uitdagingen
Zoals altijd bij baanbrekende technologie zijn er duidelijke haken:
- De juiste technische route voor wereldmodellen is nog omstreden in de AI-gemeenschap. Welke data uiteindelijk het meest waardevol is, is nog onduidelijk.
- Grote spelers (zoals Google / DeepMind) hebben vaak meer middelen. General Intuition komt in competitie met deze zwaargewichten.
- Buiten de game-ruimte: de stap naar echte fysieke omgevingen is complexer. Simulaties vervangen de werkelijkheid niet volledig, en robuuste interactie met de echte wereld vergt veel meer.
- Data-voordeel: De Witte waarschuwt dat zodra modellen beter worden, ze minder data nodig hebben — wat betekent dat vroege dataverzamelaars hun voorsprong kunnen zien afnemen.
De verschuiving is tastbaar: AI gaat van “herkennen wat mensen zeggen of schrijven” naar “begrijpen wat mensen en objecten doen in ruimte en tijd”. Wereldmodellen vertegenwoordigen mogelijk het volgende grote plateau in kunstmatige intelligentie — en gaming-data (via Medal) zou een onverwachte, maar strategisch briljante, springplank kunnen zijn. Zoals vaak in de tech: wie eerst meester wordt in het domein met de juiste data en infrastructuur, kan domineren. De vraag is: wie wordt dat?









