Op 28 augustus 2025 onthulde OpenAI een nieuw hoofdstuk in de wereld van kunstmatige intelligentie: gpt-realtime, een model dat niet alleen woorden begrijpt, maar ook kan spreken, luisteren en reageren alsof er een mens aan de andere kant van de lijn zit. Met de introductie van de Realtime API wordt spraak-AI sneller, natuurlijker en veel veelzijdiger.
Van monotone robotstem naar levensecht gesprek
Wie ooit met een digitale assistent heeft gesproken, herinnert zich waarschijnlijk de houterige intonatie en de trage reacties. OpenAI belooft daar nu radicaal mee te breken.Het nieuwe model klinkt menselijker dan ooit: het kan lachen, emoties uitdrukken, accenten aannemen en zelfs de snelheid of toon aanpassen op verzoek. Een instructie als “doe alsof je een vrolijke Franse gids bent” verandert meteen de manier waarop de AI zich uitdrukt
Een gesprek dat niet alleen over woorden gaat
Maar gpt-realtime gaat verder dan spraak alleen. Het herkent non-verbale geluiden, kan soepel schakelen tussen talen in één zin, en leest cijfers of symbolen foutloos voor. Waar oudere modellen nog regelmatig haperden, behaalt gpt-realtime nu indrukwekkende scores in internationale benchmarks.In de Big Bench Audio-test steeg de nauwkeurigheid bijvoorbeeld van 65,6% naar maar liefst 82,8%.
OpenAI gives its voice agent superpowers to developers - look for more apps soonThe company's AI voice offerings just got several new capabilities, including MCP support. |
Slimmer luisteren, sneller reageren
Een van de grootste uitdagingen in voice-AI is snelheid. Niemand wil seconden wachten voordat een stem reageert. Dankzij slimme asynchrone functieaanroepen blijft gpt-realtime vloeiend in gesprek, zelfs terwijl het op de achtergrond ingewikkelde berekeningen uitvoert.
|
OpenAI presents new speech-to-speech modelOpenAI, Inc. announced on Thursday its new speech-to-speech model for developers called gpt-realtime.The company stated in a media release that the new voice model shows |
Meer dan spraak: Zien, begrijpen en handelen
De nieuwe Realtime API geeft ontwikkelaars een rijk palet aan mogelijkheden.
- Beeldherkenning: gebruikers kunnen foto’s of screenshots meesturen, waarna de AI uitlegt wat er te zien is.
- Externe MCP-servers: door simpelweg een URL te koppelen, krijgt de AI toegang tot extra tools.
- Telefonie via SIP: de technologie kan direct telefoongesprekken voeren via openbare netwerken en PBX-systemen.
Met andere woorden: spraak-AI wordt niet langer beperkt tot een gesloten app, maar wordt een volwaardige assistent in uiteenlopende contexten.
In crowded voice AI market, OpenAI bets on instruction-following and expressive speech to win enterprise adoptionOpenAI's new speech model, gpt-realtime, hopes that its more naturalistic voices would make enterprises use more AI generated voices in applications. |
Veiligheid voorop
OpenAI benadrukt dat snelheid en intelligentie niet ten koste mogen gaan van veiligheid.De API bevat daarom ingebouwde classifiers die gesprekken in realtime bewaken. Worden de regels overtreden, dan kan de sessie onmiddellijk worden onderbroken. Bovendien kunnen ontwikkelaars hun eigen veiligheidsrails toevoegen, bijvoorbeeld via de Agents SDK.
Beschikbaar voor iedereen – en goedkoper
De nieuwe technologie is vanaf vandaag beschikbaar voor ontwikkelaars, mét een prijs die 20% lager ligt dan die van het vorige preview-model.
- Audio-invoer: $32 per miljoen tokens
- Audio-uitvoer: $64 per miljoen tokens
Zo wil OpenAI het aantrekkelijk maken voor startups, bedrijven en creatieve makers om de sprong naar realtime spraak-AI te wagen.
OpenAI introduces new speech-to-speech AI modelOpenAI on announced its “most capable” speech-to-speech AI model, gpt-realtime. |
Een nieuwe manier van communiceren
Met gpt-realtime lijkt de grens tussen mens en machine opnieuw te vervagen.Het gaat niet langer om het intypen van opdrachten, maar om een gesprek dat voelt als tweerichtingsverkeer. Een stem die begrijpt, reageert en zelfs emoties kan nabootsen.
Voor OpenAI is dit meer dan een productrelease: het is een stap richting een toekomst waarin praten met AI net zo vanzelfsprekend wordt als bellen met een vriend.
|
OpenAI Says New Speech-to-Speech Model Designed for Customer Support | PYMNTS.comOpenAI has released gpt-realtime, which the firm said is better at following complex instructions and producing more natural speech. |









