Van tekstbots naar intelligente AI-agenten
Waar AI-systemen vroeger vooral met tekst werkten, verschuift de focus nu naar multimodale AI: systemen die tegelijk beelden, video, audio en tekst kunnen verwerken.
Tijdens een speciale 90 minuten durende hands-on workshop van Google Cloud lieten AI-experts zien hoe ontwikkelaars zulke nieuwe generatie agenten kunnen bouwen. In de livestream – gepresenteerd door Ayo Adedeji en Annie Wang – werd stap voor stap uitgelegd hoe je AI-agenten ontwikkelt die veel verder gaan dan een chatbot.
De boodschap van de workshop was duidelijk: De toekomst van AI ligt niet in één interface, maar in systemen die meerdere soorten informatie tegelijk begrijpen.
Wat zijn multimodale AI-agenten?
Multimodale AI-agenten zijn intelligente systemen die verschillende soorten data combineren om beslissingen te nemen of taken uit te voeren.
In plaats van alleen tekst te analyseren, kunnen ze bijvoorbeeld:
- afbeeldingen interpreteren
- video analyseren
- audio of spraak herkennen
- tekst begrijpen en genereren
Door deze informatie te combineren ontstaat een veel rijker begrip van situaties.
Een AI-agent kan bijvoorbeeld:
- een foto analyseren en automatisch een beschrijving genereren
- een video bekijken en belangrijke gebeurtenissen samenvatten
- audiofragmenten herkennen en context toevoegen
- beelden combineren met tekst om complexe vragen te beantwoorden
Volgens Google vormt dit de basis van de volgende generatie AI-toepassingen.
Praktisch bouwen met Vertex AI
Tijdens de workshop leerden deelnemers hoe ze zulke agenten kunnen bouwen met Vertex AI, het AI-platform van Google Cloud.
De demonstratie liet zien hoe ontwikkelaars:
- multimodale modellen integreren
- AI-agenten configureren met tools en API’s
- agents laten samenwerken met externe systemen
- toepassingen deployen in een cloudomgeving
Een belangrijk hulpmiddel hierbij is het Agent Development Kit (ADK). Dit framework helpt ontwikkelaars om AI-agenten te bouwen die zelfstandig taken uitvoeren, tools gebruiken en informatie ophalen uit verschillende bronnen.
Het doel: AI-agenten creëren die echte workflows automatiseren, niet alleen antwoorden genereren.
Agent-to-Agent samenwerking
Een opvallend onderdeel van de workshop was het concept A2A (Agent-to-Agent).
Daarmee kunnen verschillende AI-agenten met elkaar samenwerken om complexe taken op te lossen.
Denk bijvoorbeeld aan een systeem waarbij:
- een agent beelden analyseert
- een tweede agent audio interpreteert
- een derde agent de resultaten combineert en een rapport schrijft
Zo ontstaat een AI-ecosysteem van gespecialiseerde agenten die samen problemen oplossen.
Dit sluit aan bij een bredere trend in AI: Multi-agent systemen die functioneren als digitale teams.
MCP-servers en AI-infrastructuur
Google Cloud demonstreerde ook hoe MCP-servers (Model Context Protocol) helpen om AI-agenten veilig toegang te geven tot data, tools en context.
Dit maakt het mogelijk dat AI-systemen:
- data uit meerdere bronnen gebruiken
- workflows automatiseren
- bedrijfssoftware integreren
- veilig communiceren met andere systemen
Voor bedrijven betekent dit dat AI-agenten niet alleen experimenten zijn, maar productieklaar kunnen worden ingezet binnen organisaties.
Waarom multimodale AI belangrijk wordt
De overgang naar multimodale AI is volgens experts onvermijdelijk. De reden is eenvoudig: de echte wereld bestaat uit meer dan tekst.
Mensen communiceren via:
- beelden
- geluid
- video
- context
- interactie
AI-systemen die al deze signalen tegelijk begrijpen, kunnen veel beter functioneren als digitale assistenten of autonome agents.
Dat opent nieuwe mogelijkheden in sectoren zoals:
- gezondheidszorg
- logistiek
- media
- retail
- educatie
- industriële automatisering
De volgende stap in AI-ontwikkeling
De workshop van Google Cloud laat zien dat AI-ontwikkeling een nieuwe fase ingaat.
De focus verschuift van: “vragen stellen aan een model” naar“ autonome AI-agenten bouwen die taken uitvoeren”.
Met tools zoals Vertex AI, ADK en agent-ecosystemen wordt het steeds eenvoudiger om zulke systemen te ontwikkelen.
Voor ontwikkelaars betekent dit een belangrijke verschuiving: Niet langer alleen prompts schrijven, maar intelligente AI-systemen ontwerpen.









