een baanbrekend nieuw onderzoek van Google Research hebben onderzoekers het heersende geloof dat je simpelweg “meer AI-agenten nodig hebt” op de proef gesteld — en zijn ze tot verrassende inzichten gekomen over wanneer en waarom agentensystemen wél effectief werken.
Het nieuwe paradigma: Van losse voorspellingen naar echte agent-interacties
Traditionele AI-modellen worden vaak geëvalueerd op één enkele voorspelling of antwoord. Maar echte AI-agenten — systemen die kunnen redeneren, plannen en handelen — werken meestal via complexe, meerdere stappen durende interacties met hun omgeving. Hierdoor ontstaat een nieuw vraagstuk: hoe ontwerp je zulke systemen zó dat ze optimaal presteren?
In hun studie hebben de onderzoekers 180 verschillende agentconfiguraties geanalyseerd en zo de allereerste kwantitatieve principes voor het schalen van agentensystemen afgeleid.
Towards a science of scaling agent systems: When and why agent systems work
|
Wat maakt een taak “agent-achtig”?
Voordat je kunt bepalen of een agentensysteem goed werkt, moet je eerst begrijpen welke taken écht agent-achtig zijn. Volgens Google Research moet een taak aan drie voorwaarden voldoen:
- Meerdere opeenvolgende interactiestappen, niet slechts één antwoord.
- Iteratieve informatieverzameling met onvolledige gegevens.
- Adaptieve strategieaanpassing op basis van feedback uit de omgeving.
Hierdoor worden klassieke benchmarks — die vooral kijken naar kennis — onvoldoende om agentensystemen goed te evalueren.
Vijf soorten agent-architecturen vergeleken
De studie onderzocht vijf verschillende structuren voor agentensystemen:
- Single-Agent System (SAS): één enkele agent die alles na elkaar doet, met één geheugenstroom.
- Multi-Agent: Independent: meerdere agenten werken parallel, zonder onderlinge communicatie.
- Centralized: een centrale “orchestrator” deelt taken uit en verzamelt resultaten.
- Decentralized: agenten communiceren direct met elkaar in een peer-to-peer-structuur.
- Hybrid: mix van centrale controle en peer-to-peer-communicatie.
Deze varianten werden getest op diverse taken zoals financiële analyse, webnavigatie en planning.
De mythe: Meer agenten is altijd beter
Een populair uitgangspunt binnen agent-AI was dat meer agenten altijd betere resultaten leveren. Die gedachte blijkt echter teveel simplistisch.
De onderzoekers ontdekten dat meer agenten niet automatisch beter presteren — tenzij het type taak en de structuur van het systeem daarop zijn afgestemd.
🟢 Parallelle taken winnen met samenwerking
Bij taken die goed opgesplitst kunnen worden (zoals financiële data-analyse) levert een goed gecoördineerde groep agenten enorme voordelen op — soms tot bijna 80 % beter dan een enkele agent.
🔴 Sequentiële taken presteren juist slechter
In scenario’s waarin stappen strak op elkaar volgen (bijvoorbeeld planning), zorgde het gebruik van meerdere agenten juist voor achteruitgang — tot wel 70 % slechter. Communicatie-overhead en gecoördineerd geheugenverlies spelen hierbij een rol.
Het onverwachte: coördinatie-kosten zijn een bottleneck
Wanneer taken veel externe tools vereisen (bijvoorbeeld code-generatie met externe API’s), blijkt dat coördinatie tussen agenten een significante overhead vormt — zelfs zodanig dat het de voordelen van meerdere agenten tenietdoet.
Betrouwbaarheid: foutversterking is architectuur-afhankelijk
Een ander belangrijk inzicht uit het onderzoek is dat verschillende agentarchitecturen verschillend omgaan met fouten:
- Onafhankelijke agenten kunnen fouten tot wel 17× versterken.
- Gecentraliseerde coördinatie blijkt veel beter in het begrenzen van foutpropagatie.
Dit betekent dat de architectuur niet alleen prestaties beïnvloedt, maar ook de betrouwbaarheid van de agentensystemen.
Een voorspellend model voor architectuurkeuze
Tot slot bouwden de onderzoekers een model dat op basis van meetbare taakkenmerken kan voorspellen welke agentarchitectuur het beste werkt — en dat klopt in ongeveer 87 % van de gevallen, zelfs op onbekende taken.
Conclusie: richting een wetenschappelijk fundament voor agent-AI
De studie markeert een belangrijke verschuiving van intuïtieve heuristieken (“meer agenten is beter”) naar principes die je kunt meten en toepassen. Door slim te ontwerpen — met oog voor taakstructuur en de juiste agentarchitectuur — kunnen AI-systemen zowel efficiënter als betrouwbaarder worden.









