Google brengt AI-gesprekken naar elke telefoonlijn
In een nieuwe demonstratie van Google DeepMind laat developer Thor Schaeff zien hoe spraakgestuurde AI niet langer beperkt blijft tot apps en browsers. Met behulp van de Gemini Live API wordt het mogelijk om een AI-agent simpelweg te bellen via een klassiek telefoonnummer.
De implicatie is groot: AI wordt niet alleen slimmer, maar ook bereikbaarder, letterlijk voor iedereen met een telefoon.
Eén AI-agent, meerdere kanalen
Gemini vormt het hart van deze setup. Dankzij een slimme integratie met Twilio kan dezelfde AI-agent zowel in een browser als via telefonie functioneren, zonder aparte implementaties.
Dat betekent:
- Eén deployment
- Eén AI-brein
- Meerdere toegangspunten (web én telefoon)
De gebruiker merkt geen verschil. Of je nu klikt of belt, je spreekt met dezelfde intelligente assistent.
De technologie achter de magie
Achter deze eenvoudige ervaring schuilt een behoorlijk technische architectuur. De demo toont hoe ontwikkelaars verschillende tools combineren tot één vloeiende ervaring:
Realtime communicatie en backend
- Met FastAPI en WebSockets wordt realtime communicatie mogelijk gemaakt
- Inkomende en uitgaande oproepen worden dynamisch verwerkt
- Audio wordt continu gestreamd tussen systemen
Audiovertaling tussen systemen
Een cruciale stap is het omzetten van audioformaten:
- Gemini gebruikt een ander formaat dan Twilio
- Conversie van PCM naar mu-law zorgt voor compatibiliteit
Zonder deze vertaalslag zou een telefoongesprek simpelweg niet werken.
Van prototype naar productie in de cloud
De volledige oplossing wordt uitgerold via Google Cloud, meer specifiek met Cloud Run.
Dit maakt het mogelijk om:
- Schaalbare voice agents te bouwen
- Gevoelige data veilig te beheren via Secret Manager
- Eén centrale deployment te gebruiken voor alle kanalen
De stap van experiment naar productie wordt hiermee aanzienlijk kleiner.
Sneller bouwen met AI-agents
Opvallend is dat niet alleen de eindgebruiker profiteert van AI, ook de ontwikkelaar zelf.
Met behulp van zogenaamde “coding agents” (zoals Antigravity) wordt het ontwikkelproces versneld. Taken zoals:
- API-integraties
- Endpoint configuraties
- Codegeneratie
worden deels geautomatiseerd, waardoor complexe systemen sneller gebouwd kunnen worden.
De toekomst: AI die je gewoon kunt bellen
Wat deze demo vooral duidelijk maakt, is dat AI zich steeds minder als software gedraagt en steeds meer als een dienst die altijd bereikbaar is.
Een AI die je belt.Of die jij belt.
Dat opent deuren naar toepassingen zoals:
- Klantenservice zonder wachttijden
- Persoonlijke assistenten op elk moment van de dag
- Toegankelijke AI voor mensen zonder smartphone of apps
De drempel tot AI verdwijnt en een simpel telefoongesprek wordt de nieuwe interface.









