Het technologiebedrijf OpenAI trok onlangs veel aandacht door te stellen dat hun model GPT‑5 tien voorheen onopgeloste wiskundige problemen had opgelost. Kort daarna bleek dat die claims zwaar overdreven waren — wat aanleiding gaf tot verontwaardiging binnen de wetenschappelijke gemeenschap.
Leading OpenAI researcher announced a GPT-5 math breakthrough that never happenedOpenAI researchers recently claimed a major math breakthrough on X, but quickly walked it back after criticism from the community, including Deepmind CEO Demis Hassabis, who called out the sloppy communication. |
Wat werd er beweerd?
De ophef begon met een tweet van OpenAI-manager Kevin Weil waarin werd gezegd dat GPT-5 “oplossingen had gevonden voor 10 (!) eerder onopgeloste problemen van Paul Erdős” en tevens “vooruitgang had geboekt” op 11 andere problemen. De bewoording maakte de indruk dat GPT-5 zelfstandig wiskundige bewijzen had geproduceerd — een doorbraak in de wiskunde zou dat betekenen.
OpenAI’s ‘embarrassing’ math | TechCrunchNo, GPT-5 did not solve a bunch of previously unsolved math problems. |
De feiten: Wat bleek er echt aan de hand te zijn?
Onderzoekers zoals Thomas Bloom (beheerder van de site erdosproblems.com) stelden dat de problemen waarover werd gesproken niet daadwerkelijk onopgelost waren in de betekenis van de wiskundige gemeenschap. Op de vermelding “open” op zijn site had men vaak simpelweg geen kennis van een oplossing — niet dat er géén artikel of bewijs bestond. In werkelijkheid had GPT-5 volgens Bloom alleen bestaande oplossingen teruggevonden die hij nog niet kende.
OpenAI Retracts Exaggerated Claims on GPT-5 Solving Erdős ProblemsOpenAI Retracts Exaggerated Claims on GPT-5 Solving Erdős Problems Competitors criticize misleading promotion amid OpenAIs monetization push OpenAI ha |
Reacties en kritiek
De reactie was scherp. Demis Hassabis, CEO van DeepMind, noemde de communicatie “embarrassing” (beschamend). Ook Yann LeCun van Meta hekelt wat hij ziet als een veelgehoorde onderschatting van verificatie binnen AI-claims. OpenAI gaf later toe dat de formulering te ambitieus en onzorgvuldig was — de oorspronkelijke tweet werd verwijderd.
Wat is de kern van de misvatting?
Het gaat hier niet alleen om een misleidende tweet, maar om een fundamenteel verschil in de interpretatie van ‘onopgelost’ probleem. In wiskundige kringen betekent “onopgelost” dat er geen geaccepteerd, gepubliceerd bewijs is dat het probleem definitief afrondt. De controverse laat zien dat het woordgebruik hier door OpenAI té los werd gehanteerd.Daarnaast wordt benadrukt dat GPT-5 in dit geval vooral functioneerde als literatuurzoek- en-vindmachine, niet als autonome ontdekker van nieuwe wiskunde.
|
OpenAI faces backlash over claims of math breakthroughsOpenAI is taking heavy flak from all quarters of the AI and math communities after its researchers touted an earlier version of its new model as useful |
Betekenis voor AI en toekomstonderzoek
Hoewel de claims van OpenAI zich uiteindelijk als hype ontpopten, is er volgens sommige deskundigen wel een bredere les: modellen als GPT-5 kunnen waardevolle hulpmiddelen zijn bij wiskundig onderzoek — bijvoorbeeld bij het doorzoeken van literatuur, het vinden van relevante papers of het versnellen van routinematige taken. Maar: het autonome produceren van originele, hoogwaardige wiskundige bewijzen blijft vooralsnog buiten bereik.
De saga rond GPT-5’s vermeende wiskundige triomf is een waarschuwing voor de hype-cultuur in de AI-wereld. Ook een vooraanstaand institutioneel acteur als OpenAI blijkt vatbaar voor overdreven claims — met reputatieschade tot gevolg. Het incident onderstreept de noodzaak van verificatie, voorzorg en sober taalgebruik rond wat AI wél en nog níet kan.Tegelijkertijd opent het debat over hoe we AI-modellen correct kunnen inzetten als hulpmiddel voor wetenschappelijk onderzoek — met realistische verwachtingen.









