OpenAI begint met de uitrol van geavanceerde spraakmodus

dinsdag, 30 juli 2024
Ivan Jans

Weet je nog die indrukwekkende demo van de nieuwe spraakmogelijkheden van ChatGPT die OpenAI afgelopen mei liet zien? Het is nu niet langer alleen een demo. OpenAI is begonnen met de uitrol van de "Geavanceerde Spraakmodus" voor een selecte groep ChatGPT Plus-gebruikers. Voor degenen die nog niet tot de gelukkigen behoren: geen zorgen, alle Plus-gebruikers zouden tegen de herfst toegang moeten krijgen.

Een natuurlijkere manier van communiceren met AI

De nieuwe spraakmodus brengt meer natuurlijke, realtime gesprekken met de AI. Gebruikers kunnen op elk moment onderbreken, en het systeem is ontworpen om emoties te herkennen en daarop te reageren. Dit is een wereld van verschil met de statische, beurtgebaseerde interacties die we gewend zijn van virtuele assistenten zoals Siri en Alexa.

Bij de aankondiging van de uitrol benadrukte OpenAI's CTO, Mira Murati, dat deze technologie als meer collaboratief en behulpzaam wordt ervaren. Toch was de weg naar de lancering niet zonder obstakels.

Live demo of GPT-4o realtime conversational speech

Controverse rond de “Sky” stem

Tijdens de oorspronkelijke demo gebruikte OpenAI een stem genaamd "Sky", die opviel vanwege de opvallende gelijkenis met de stem van actrice Scarlett Johansson. De actrice ontkende elke betrokkenheid bij het project en liet weten eerder toestemming voor het gebruik van haar gelijkenis te hebben geweigerd. Ze dreigde met juridische stappen.

Hoewel OpenAI snel ontkende iets verkeerds te hebben gedaan en gedetailleerd uitlegde hoe hun stemmen waren ontwikkeld, besloten ze de controversiële "Sky"-stem als optie te verwijderen. Voor nu maakt het systeem gebruik van vier andere vooraf ingestelde stemmen, ontwikkeld met betaalde stemacteurs: Breeze, Cove, Ember en Juniper.

Veiligheid voorop: Een verantwoorde uitrol

Naar aanleiding van deze kwestie kondigde OpenAI een vertraging aan in de lancering van de Geavanceerde Spraakmodus. Dit gaf hen tijd om verdere veiligheidstests uit te voeren en het model te verbeteren in het detecteren en afwijzen van bepaalde verzoeken. Ze voegden ook ingebouwde filters toe om te voorkomen dat het systeem auteursrechtelijk beschermd materiaal genereert. Deze behoedzame aanpak benadrukt de uitdagingen waarmee AI-bedrijven worden geconfronteerd terwijl ze de grenzen van technologische mogelijkheden verkennen.

Naarmate AI meer multimodale capaciteiten krijgt en interacties menselijker worden, zullen kwesties rond toestemming, auteursrechten en ethisch gebruik steeds crucialer worden. Hoewel het frustrerend kan zijn om te moeten wachten, benadrukt deze uitrol een belangrijk punt: voorzichtigheid bij de implementatie van geavanceerde AI-technologie is niet alleen verstandig, het is essentieel.

Balanceren tussen innovatie en verantwoordelijkheid

De AI-gemeenschap is soms kritisch geweest over de vertraagde releases van OpenAI, zoals Sora en GPT-4o met video. Toch moeten we ook waarderen dat het een delicate evenwichtsoefening is. Als maatschappij hebben we tijd nodig: tijd om AI-geletterdheid te vergroten, tijd om verouderde wetten te actualiseren en tijd om governance en toezicht te ontwikkelen.

De aankondiging van vandaag betekent dat een meer betrokken AI-ervaring binnen handbereik is. Maar het herinnert ons ook aan het complexe landschap dat we bewandelen terwijl AI steeds capabeler wordt en een steeds grotere rol gaat spelen in ons persoonlijke en professionele leven.

OpenAI begint met de uitrol van geavanceerde spraakmodus

Een natuurlijkere manier van communiceren met AI

Controverse rond de “Sky” stem

Veiligheid voorop: Een verantwoorde uitrol

Balanceren tussen innovatie en verantwoordelijkheid

Aanbevolen voor jou

TRENDING DEZE MAAND

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Inschrijven Nieuwsbrief

Kies voor een UP-TO-DATE AI Website 100% in Google

UP-TO-DATE WebDesign BV

UP-TO-DATE AI Today

Voor u aanbevolen

Een natuurlijkere manier van communiceren met AI

Controverse rond de “Sky” stem

Veiligheid voorop: Een verantwoorde uitrol

Balanceren tussen innovatie en verantwoordelijkheid

Aanbevolen voor jou

TRENDING DEZE MAAND

De 20 belangrijkste technologische trends voor 2025

Google neemt afscheid van 'I'm Feeling Lucky': AI Mode neemt het over na 27 jaar

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Inschrijven Nieuwsbrief

Kies voor een UP-TO-DATE AI Website 100% in Google

UP-TO-DATE WebDesign BV

UP-TO-DATE AI Today

Voor u aanbevolen