Op 1 december 2025 kwam een nieuwe ster aan het firmament van AI-agenten: OpenAGI, een stealth-startup opgericht door onderzoekers van MIT, onthulde zijn model Lux — en beweert dat het “computers besturen beter doet dan de modellen van OpenAI of Anthropic, en dat nog tegen een fractie van de kostprijs”.
Lux: een agent die niet schrijft, maar handelt
In tegenstelling tot klassieke taalmodellen die enkel tekst genereren, is Lux ontworpen om computers te besturen: hij interpreteert schermafbeeldingen, navigeert door applicaties, klikt, typt, en voert acties uit — zowel in browsers als op desktopapplicaties zoals spreadsheets, Slack of design-software. Volgens OpenAGI behaalde Lux een indrukwekkende score van 83,6% op de benchmark Online‑Mind2Web, “de strengste test voor AI-agenten die computers bedienen”. Ter vergelijking: de agent van OpenAI haalt 61,3%, die van Anthropic 56,3%.
Een andere trainingslogica
Hoe kon een relatief kleine startup zulke prestaties neerzetten? Volgens CEO Zengyi Qin door een radicaal andere trainingsmethode: in plaats van tekst te leren voorspellen, leert Lux “acties” — getraind op duizenden schermafbeeldingen gekoppeld aan muisklikken, toetsenbordinteracties en navigaties. Op die manier leert het model visuele interfaces begrijpen en zelfstandig acties plannen. Bovendien beweert OpenAGI dat Lux ongeveer tien keer goedkoper draait dan de toonaangevende agent-modellen én sneller taken uitvoert.
Verder dan enkel browsers — native desktop apps binnen bereik
Waar veel agenten vandaag beperkt blijven tot browser-automatisering, belooft Lux veel meer: volledige controle over desktopsoftware. Denk aan Excel-sheets, communicatietools, design-of code-omgevingen. Dat opent de deur naar veel bredere productiviteits-toepassingen. OpenAGI biedt ook een SDK aan — externe ontwikkelaars kunnen dus eigen tools en workflows bouwen bovenop Lux.
Veiligheid en risico’s onder de loep
Een AI-agent die klikt, typt en navigeert dwingt tot extra voorzichtigheid. Lux bevat volgens OpenAGI al veiligheidsmechanismes: als een gebruiker vraagt om gevoelige data te kopiëren (bv. bankgegevens), weigert de agent en waarschuwt hij. Toch waarschuwen onafhankelijke onderzoekers dat “agentic AI” nieuwe kwetsbaarheden introduceert, zoals prompt-injections of misbruik van automatisatie om kwaadaardige taken uit te voeren.
Wat zegt de lancering over de race om autonome agenten?
De lancering van Lux markeert mogelijk een kantelpunt: het laat zien dat kleine, onafhankelijke teams — met slimme architectuur en aangepaste training — kunnen concurreren met goed gefinancierde giganten. Als Lux in de praktijk inderdaad even goed presteert als in laboratoriumtests, dan wijst dat op een paradigmaverschuiving: productiviteitstools mogelijk bouwen zonder enorme cloud-infrastructuur en met minder kosten.
Toch is voorzichtigheid geboden: benchmarks zijn één ding, echte wereld iets anders. De reële uitdaging zit in betrouwbaarheid, edge-cases, veiligheid én consistentie wanneer Lux urenlang taken moet uitvoeren in complexe workflows — iets waar veel beloftevolle agenten al eerder op zijn gestrand.









