De stap die alles verandert
In een wereld waar AI-agents steeds meer programmeerwerk overnemen, verschuift de echte innovatie van “code genereren” naar “code bewijzen”. In een recente demonstratie toont Javi hoe Codex niet alleen een ingrijpende logging-refactor uitvoert, maar ook zelf controleert of alles nog correct werkt.
Het verschil? Het model draait de applicatie, zoekt de juiste sessie en bewijst dat de logs nog steeds correct doorstromen. Wat vroeger een risicovolle, handmatige controlecyclus was, wordt herleid tot enkele minuten.
Een brede refactor zonder breekpunten
De opdracht lijkt eenvoudig, maar is technisch gevoelig: een logging-refactor over meerdere bestanden. Logging zit vaak verweven in een volledige codebase. Eén kleine fout kan observability breken — en zonder betrouwbare logs tast een team in het duister bij bugs of incidenten.
Hier schuilt het klassieke risico:
- Meerdere bestanden aanpassen
- Interne loggingstructuur wijzigen
- Ervoor zorgen dat monitoring en tracing intact blijven
Traditioneel betekent dat: testen draaien, applicatie starten, logs manueel controleren, sessie-ID’s opzoeken, query’s uitvoeren in monitoringtools… en hopen dat niets werd gemist.
Zelfverificatie als gamechanger
Wat Codex hier anders doet, is fundamenteel. Het model voert niet alleen de codewijziging uit, maar:
- Draait de tests automatisch
- Lanceert de applicatie
- Zoekt zelf de relevante sessie-ID
- Query’t logtools via MCP
- Bewijst dat logs end-to-end blijven werken
Die zelfverificatie is geen extraatje. Het is een sprong voorwaarts.
Waar ontwikkelaars vroeger een manuele controlelus doorliepen — vaak tijdrovend en foutgevoelig — neemt het model die validatie integraal over. Het systeem toont bewijs: logs stromen nog steeds correct. Taak afgerond.
Van onzekerheid naar bewijs
De essentie van deze demonstratie is niet snelheid, maar zekerheid. Een brede refactor over veel bestanden is precies het soort taak waar risico’s opstapelen. Observability mag niet sneuvelen. Logging moet blijven functioneren. Door zelf tests te draaien en live-verificatie uit te voeren, transformeert Codex een “spannende” wijziging in een gecontroleerde operatie.
Wanneer een AI-agent kan aantonen dat iets correct werkt, verandert de dynamiek van softwareontwikkeling:
- Minder manuele controle
- Minder regressierisico
- Snellere iteratie
- Meer vertrouwen in grote wijzigingen
Waarom dit meer is dan automatisering
Veel AI-tools genereren code. Dat is ondertussen bijna standaard. Maar het vermogen om correctheid te bewijzen — door effectief de applicatie te draaien en resultaten te controleren — verschuift AI van assistent naar betrouwbare co-ontwikkelaar.
Zelfverificatie comprimeert een risicovolle workflow van uren naar minuten.En wanneer risico daalt, stijgt snelheid.
De kernboodschap
Wanneer een agent kan bewijzen dat zijn werk correct is, kan een team sneller bewegen met minder risico.Dat is de echte stapverandering.Niet alleen bouwen. Maar bouwen én verifiëren.









