Hoe meet je iets dat nog niet bestaat? DeepMind zet een nieuwe standaard
De race naar Artificial General Intelligence (AGI) versnelt, maar één cruciale vraag bleef tot nu toe onbeantwoord: hoe weet je eigenlijk dat je er bent?
Met een nieuw cognitief framework probeert Google DeepMind precies dat probleem op te lossen. In plaats van vage definities introduceert het onderzoeksinstituut een systematische manier om AI te beoordelen op basis van menselijke cognitieve vaardigheden.
|
Measuring progress toward AGI: A cognitive frameworkGoogle DeepMind proposes a cognitive framework to evaluate AGI and launches a Kaggle hackathon to build capability benchmarks |
DeepMind vertaalt intelligentie naar concrete cognitieve bouwstenen
AGI wordt vaak omschreven als AI die “alles kan wat een mens kan” — maar dat blijkt in de praktijk moeilijk te meten.
DeepMind pakt het anders aan. Hun framework:
- breekt intelligentie op in meetbare cognitieve vaardigheden
- creëert een taxonomie van denkprocessen
- maakt het mogelijk om AI-systemen objectief te vergelijken
Het idee is simpel maar krachtig: Als je menselijke intelligentie kunt opdelen in componenten zoals redeneren, geheugen en probleemoplossing, dan kun je AI ook langs diezelfde lat leggen.
Zonder meetlat geen echte vooruitgang
Vandaag bouwen bedrijven steeds krachtigere AI-systemen, maar zonder duidelijke maatstaven blijft vooruitgang moeilijk te interpreteren.
Volgens DeepMind:
- ontbreekt er een gestandaardiseerde manier om AGI te definiëren
- vergelijken bedrijven hun modellen vaak met verschillende criteria
- ontstaat er verwarring over wat “intelligent” echt betekent
Het nieuwe framework moet dienen als een gemeenschappelijke taal voor de industrie — vergelijkbaar met hoe IQ-tests ooit menselijke intelligentie probeerden te structureren.
Iedereen kan meebouwen aan de meetlat van de toekomst
Opvallend is dat DeepMind niet alles zelf wil bepalen. Ze lanceren tegelijk een wereldwijde Kaggle-hackathon met een prijzenpot van $200.000.
Doel:
- ontwikkelaars laten helpen bij het bouwen van evaluaties en benchmarks
- een ecosysteem creëren rond open en reproduceerbare tests
- sneller evolueren naar betrouwbare AGI-metingen
Met andere woorden: De meetlat voor AGI wordt niet achter gesloten deuren gebouwd, maar crowdsourced.
Van “beginnend” tot “supermenselijk”
DeepMind sluit aan bij een bredere visie waarin AGI geen binaire status is, maar een schaal.
Eerdere modellen onderscheiden bijvoorbeeld niveaus zoals:
- emerging (beginnend)
- competent
- expert
- superhuman
Het nieuwe framework helpt om die niveaus concreet te onderbouwen met meetbare prestaties, in plaats van speculatie.
Dit verandert hoe bedrijven AI bouwen én begrijpen
Als dit framework aanslaat, heeft dat grote gevolgen:
- Bedrijven kunnen AI-systemen objectief benchmarken
- Onderzoekers krijgen duidelijkere doelen
- Overheden kunnen beter reguleren
- Gebruikers begrijpen beter wat AI wel en niet kan
En misschien nog belangrijker: het verschuift de discussie van 👉 “Hoe krachtig is deze AI?”naar👉 “Welke cognitieve vaardigheden beheerst deze AI écht?”
Conclusie: De eerste echte meetlat voor AGI
Met dit cognitieve framework zet Google DeepMind een belangrijke stap richting volwassen AI-ontwikkeling.
Niet door nóg grotere modellen te bouwen, maar door eindelijk te definiëren wat “intelligentie” betekent — en hoe we die kunnen meten.
De implicatie is duidelijk: 👉 De toekomst van AI draait niet alleen om schaal, maar om begrip.









