Onderzoekers zetten grote stappen richting zelfverbeterende kunstmatige intelligentie – zonder menselijke tussenkomst
AI leert zichzelf trainen: een nieuwe mijlpaal
Twee toonaangevende onderzoeksinstituten, MIT en AI-start-up Anthropic, hebben onafhankelijk van elkaar baanbrekende vooruitgang geboekt in het ontwikkelen van zelfverbeterende AI-systemen. In plaats van afhankelijk te zijn van menselijke tussenkomst voor updates of bijsturing, leren deze systemen zichzelf bij – een fundamentele stap in de richting van volwaardige autonome intelligentie.
MIT introduceert SEAL: Zelfevaluatie als leerproces
MIT-onderzoekers ontwikkelden het SEAL-systeem (Self-Evaluating and Learning), een techniek waarbij een taalmodel zichzelf kritisch evalueert en verbetert door middel van gerichte feedback. Dit proces bootst menselijke leerstrategieën na: het model genereert meerdere antwoorden op een vraag, vergelijkt die met elkaar, en kiest uiteindelijk de beste op basis van zelfreflectie. Door deze methode herhaalt het model steeds zijn eigen "denkproces", waarbij het voortdurend leert van fouten en successen.
Volgens de onderzoekers is deze aanpak schaalbaar en efficiënter dan conventionele methoden waarbij duizenden annotatoren nodig zijn om data te labelen. SEAL vereist geen menselijke input tijdens het leerproces – een cruciale doorbraak op weg naar autonoom lerende AI.
Anthropic’s LLMs leren zichzelf bijsturen
Ook Anthropic, bekend van het AI-model Claude, presenteert een nieuwe methode waarmee taalmodellen zichzelf kunnen fine-tunen. In plaats van door mensen handmatig hertraind te worden, leren deze modellen uit hun eigen fouten via feedbackloops. Ze genereren hun eigen trainingsdata en verbeteren zichzelf op basis van eigen gegenereerde instructies. Volgens Anthropic leidt dit tot AI-modellen die zowel robuuster als creatiever zijn.
Deze aanpak, geïnspireerd op mechanismen uit de meta-learning, maakt gebruik van zogenaamde “self-training bootstraps” waarbij een model zichzelf nieuwe taken aanleert. Daarbij speelt het zowel de rol van leraar als leerling – en dat zonder dat daar menselijke programmeurs of annotators aan te pas komen.
De toekomst van AI: richting autonomie
Beide onderzoeken wijzen in dezelfde richting: kunstmatige intelligentie die zichzelf kan verbeteren zonder externe hulp. Dit opent de deur naar AI-systemen die zich autonoom kunnen aanpassen aan veranderende omstandigheden, nieuwe domeinen kunnen verkennen en zelfkennis ontwikkelen – iets wat tot voor kort nog puur sciencefiction leek.
Toch waarschuwen de onderzoekers voor overhaaste toepassingen. Hoewel de resultaten veelbelovend zijn, benadrukken ze dat veiligheid, controle en ethiek voorop moeten blijven staan. Zelfverbeterende AI roept immers ook vragen op over transparantie, betrouwbaarheid en verantwoordelijkheid.
Conclusie: zelfdenkende AI is geen verre droom meer
De ontwikkelingen van MIT en Anthropic maken duidelijk dat we aan de vooravond staan van een nieuw AI-tijdperk. Kunstmatige intelligentie die zichzelf evalueert, bijstuurt en leert – zonder menselijke tussenkomst – is niet langer een toekomstvisie, maar een realiteit in wording. Of dit leidt tot een nieuwe generatie betrouwbare digitale assistenten, of tot ongecontroleerde AI-systemen, zal afhangen van hoe voorzichtig en doordacht deze technologie wordt ingezet.
This AI Model Never Stops LearningScientists at Massachusetts Institute of Technology have devised a way for large language models to keep learning on the fly—a step toward building AI that continually improves itself. |