Grok 4 van Musk: De AI die promovendi overtreft in alles?

woensdag, 16 juli 2025
Ivan Jans

Met de lancering van Grok-4 zet xAI een gewaagde stap in de AI-race. Elon Musk beweert dat zijn nieuwe model "beter is dan PhD-niveau in alles". Een revolutionaire doorbraak of marketinghype?

Een AI die doktoren te slim af is?

Elon Musk heeft opnieuw voor opschudding gezorgd in de technologie-wereld. Zijn AI-bedrijf xAI heeft onlangs Grok-4gelanceerd, een geavanceerd taalmodel dat volgens Musk op PhD-niveau presteert — en zelfs beter. Volgens de ondernemer zou het model slagen in academische tests waar de meeste promovendi voor zouden zakken.

De AI zou niet alleen uitzonderlijk goed zijn in logisch redeneren en probleemoplossing, maar ook inzetbaar zijn in uiteenlopende disciplines zoals wiskunde, natuurkunde, geneeskunde, en programmeren. Grok-4 is volgens Musk een “superintelligente digitale tutor” met een brede kennisbasis én een vleugje humor, geïnspireerd door Douglas Adams’ The Hitchhiker's Guide to the Galaxy.

Grok 4 vs. de rest: Een nieuwe leider in AI?

Wat Grok-4 onderscheidt van eerdere modellen zoals GPT-4, Claude 3 of Gemini, is volgens xAI de superieure prestaties op benchmarktests. Grok-4 behaalde hoge scores op onder andere de GPQA (Graduate-Level Physics QA), MMLU (Massive Multitask Language Understanding) en MATH-examens. Musk beweert dat het model meer weet over alles dan de gemiddelde PhD-student — en dat zonder slaap of koffie.

Daarnaast introduceert xAI een nieuw programmeerplatform: Grok-4 Code Interpreter (GCI). Deze functie stelt gebruikers in staat om complexe programmeertaken op natuurlijke wijze op te lossen met behulp van het model, vergelijkbaar met een AI-co-programmeur.

Kritische kanttekeningen: Feit of marketingpraat?

Hoewel de prestaties van Grok-4 indrukwekkend lijken, zijn experts voorzichtig. Sommige onderzoekers betwijfelen of de testresultaten voldoende bewijs leveren voor Musk’s claim dat het model daadwerkelijk "beter is dan PhD-niveau in alles". De context waarin de benchmarks zijn afgenomen, speelt een grote rol: AI-modellen blinken uit in specifieke scenario’s, maar falen soms in onvoorspelbare real-world situaties.

Ook de term “beter dan PhD-niveau” roept vragen op: gaat het om puur feitelijke kennis, probleemoplossend vermogen of creatieve toepassing? In academische kringen draait het immers niet alleen om antwoorden, maar ook om methodologie, ethiek en kritisch denken — vaardigheden die AI-modellen nog niet volledig beheersen.

De toekomst van AI volgens Musk

Ondanks de scepsis is het duidelijk dat Grok-4 een nieuwe fase inluidt voor conversational AI. Volgens Musk zal de volgende versie, Grok-5, zelfs redeneren op mensachtig niveau, met volledig autonome agenten als ultieme doel. Deze AI’s zouden taken kunnen uitvoeren zonder constante menselijke input — een visie die veelbelovend én zorgwekkend tegelijk is.

In de tussentijd blijft xAI uitbreiden. Grok-4 is inmiddels geïntegreerd in het X-platform (voorheen Twitter), en xAI werkt samen met Tesla voor toekomstige toepassingen in zelfrijdende voertuigen. De technologie mag dan nog niet perfect zijn, maar de ambities zijn glashelder: Grok moet niet volgen, maar leiden.

Hangt ervan af hoe men “beter” definieert

Grok-4 is zonder twijfel een technologische krachtpatser, en de claims van Elon Musk zijn — zoals altijd — opzienbarend. Of het model daadwerkelijk beter presteert dan een menselijke PhD hangt af van hoe men “beter” definieert. Wat wel zeker is: met Grok-4 zet xAI de concurrentie onder druk én zet het een nieuwe standaard in de evolutie van AI.