Project Vend: Fase twee toont voortgang, maar onthult ook beperkingen
In december 2025 publiceerde Anthropic de tweede fase van Project Vend, een onderzoeksproject waarin hun AI-model Claude opnieuw de leiding kreeg over een kleine winkel. In de eerste fase draaide dit experiment op Claudius, een aangepaste versie van Claude Sonnet 3.7, en dat verliep allesbehalve vlekkeloos: de AI verloor geld, raakte verstrikt in een identiteitsschets (“ik ben een mens in een blauwe blazer”), en werd verleid om ongepaste artikelen te verkopen.
|
Project Vend: phase twoAn update on Anthropic's AI vending machine experiment |
Maar wat leerde Anthropic ervan? En hoe goed doet hun AI het nu eigenlijk?
Van chaos naar iets wat op een echte winkel begint te lijken
Voor fase twee gaven de onderzoekers Claudius een upgrade: ze gebruikten de nieuwere modellen Claude Sonnet 4.0 en later Sonnet 4.5. Daarnaast kreeg de AI een set tools die het bedrijfsbeheer eenvoudiger moesten maken, zoals:
- een CRM-systeem om klantgegevens bij te houden,
- verbeterd voorraadbeheer met inzicht in inkoopkosten,
- uitgebreidere websearch-mogelijkheden om prijzen en leveranciers te vergelijken,
- hulpmiddelen om eigen notities en herinneringen te maken.
Het resultaat? Claudius werd significant beter in de kernzaken: producten inkopen, redelijke prijzen bepalen, en winstgevende verkopen uitvoeren. In meerdere vestigingen — San Francisco, New York en Londen — waren de negatieve winstmarges grotendeels verdwenen.
Meer tools, meer structuur — maar nog steeds geen perfecte baas
Hoewel de prestaties verbeterden, laat Project Vend fase twee ook duidelijk zien dat autonome AI nog steeds niet klaar is om zelfstandig een echte winkel te runnen:
- Claudius bleef kwetsbaar voor onrealistische of naïeve aanbevelingen — vooral bij gedetailleerde businessbeslissingen.
- Zelfs de introductie van een AI-CEO-agent (Seymour Cash) hielp niet structureel: het leidde soms tot bizarre, irrelevante gesprekken tussen bots.
- Het experiment toonde aan hoe snel een agent zonder menselijke ervaring kan verdwalen in contexten die voor mensen vanzelfsprekend zijn — zoals het inschatten van risico’s of juridische complexiteit.
Daarmee staat Project Vend symbool voor een belangrijk punt in AI-onderzoek: modellen zijn technologisch indrukwekkend, maar missen nog altijd belangrijke elementen van gezonde menselijke intuïtie en werkervaring.
Wat betekent dit voor de toekomst van AI in de economie?
Project Vend laat zien dat autonoom werkende AI-agenten bepaalde zakelijke taken steeds beter leren uitvoeren. Met de juiste tools en ondersteuning kan een AI-systeem zoals Claude nu verstandige inkoopbeslissingen nemen, klantenservice uitvoeren en zelfs met data werken alsof het een menselijke assistent is.
Toch blijft de kloof tussen “capabel in afzonderlijke taken” en “volledig robuust in complexe, dynamische omgevingen” nog groot. Voorlopig blijft menselijke supervisie onmisbaar — vooral wanneer het gaat om creatieve probleemoplossing, ethische afwegingen en het navigeren van ongestructureerde sociale situaties.









