Weet je nog die indrukwekkende demo van de nieuwe spraakmogelijkheden van ChatGPT die OpenAI afgelopen mei liet zien? Het is nu niet langer alleen een demo. OpenAI is begonnen met de uitrol van de "Geavanceerde Spraakmodus" voor een selecte groep ChatGPT Plus-gebruikers. Voor degenen die nog niet tot de gelukkigen behoren: geen zorgen, alle Plus-gebruikers zouden tegen de herfst toegang moeten krijgen.
Een natuurlijkere manier van communiceren met AI
De nieuwe spraakmodus brengt meer natuurlijke, realtime gesprekken met de AI. Gebruikers kunnen op elk moment onderbreken, en het systeem is ontworpen om emoties te herkennen en daarop te reageren. Dit is een wereld van verschil met de statische, beurtgebaseerde interacties die we gewend zijn van virtuele assistenten zoals Siri en Alexa.
Bij de aankondiging van de uitrol benadrukte OpenAI's CTO, Mira Murati, dat deze technologie als meer collaboratief en behulpzaam wordt ervaren. Toch was de weg naar de lancering niet zonder obstakels.
Controverse rond de “Sky” stem
Tijdens de oorspronkelijke demo gebruikte OpenAI een stem genaamd "Sky", die opviel vanwege de opvallende gelijkenis met de stem van actrice Scarlett Johansson. De actrice ontkende elke betrokkenheid bij het project en liet weten eerder toestemming voor het gebruik van haar gelijkenis te hebben geweigerd. Ze dreigde met juridische stappen.
Hoewel OpenAI snel ontkende iets verkeerds te hebben gedaan en gedetailleerd uitlegde hoe hun stemmen waren ontwikkeld, besloten ze de controversiƫle "Sky"-stem als optie te verwijderen. Voor nu maakt het systeem gebruik van vier andere vooraf ingestelde stemmen, ontwikkeld met betaalde stemacteurs: Breeze, Cove, Ember en Juniper.
Veiligheid voorop: Een verantwoorde uitrol
Naar aanleiding van deze kwestie kondigde OpenAI een vertraging aan in de lancering van de Geavanceerde Spraakmodus. Dit gaf hen tijd om verdere veiligheidstests uit te voeren en het model te verbeteren in het detecteren en afwijzen van bepaalde verzoeken. Ze voegden ook ingebouwde filters toe om te voorkomen dat het systeem auteursrechtelijk beschermd materiaal genereert. Deze behoedzame aanpak benadrukt de uitdagingen waarmee AI-bedrijven worden geconfronteerd terwijl ze de grenzen van technologische mogelijkheden verkennen.
Naarmate AI meer multimodale capaciteiten krijgt en interacties menselijker worden, zullen kwesties rond toestemming, auteursrechten en ethisch gebruik steeds crucialer worden. Hoewel het frustrerend kan zijn om te moeten wachten, benadrukt deze uitrol een belangrijk punt: voorzichtigheid bij de implementatie van geavanceerde AI-technologie is niet alleen verstandig, het is essentieel.
Balanceren tussen innovatie en verantwoordelijkheid
De AI-gemeenschap is soms kritisch geweest over de vertraagde releases van OpenAI, zoals Sora en GPT-4o met video. Toch moeten we ook waarderen dat het een delicate evenwichtsoefening is. Als maatschappij hebben we tijd nodig: tijd om AI-geletterdheid te vergroten, tijd om verouderde wetten te actualiseren en tijd om governance en toezicht te ontwikkelen.
De aankondiging van vandaag betekent dat een meer betrokken AI-ervaring binnen handbereik is. Maar het herinnert ons ook aan het complexe landschap dat we bewandelen terwijl AI steeds capabeler wordt en een steeds grotere rol gaat spelen in ons persoonlijke en professionele leven.