De Franse AI-pionier Mistral AI heeft een nieuwe stap gezet in spraak-naar-tekst-technologie met de release van Voxtral Transcribe 2, een set geavanceerde modellen die uitblinken in snelheid, nauwkeurigheid en flexibiliteit. Het platform belooft bedrijven en ontwikkelaars meer mogelijkheden dan ooit tevoren om gesproken audio om te zetten in rijke, gestructureerde tekst – live of in batches.
|
Voxtral transcribes at the speed of sound. | Mistral AIPrecision diarization, real-time transcription, and a new audio playground. |
Twee modellen voor twee werelden: Batch en realtime
Voxtral Transcribe 2 bestaat uit twee krachtige varianten:
- Voxtral Mini Transcribe V2 – ontworpen voor het verwerken van grote hoeveelheden opgenomen audio met uitstekende transcriptie-kwaliteit, sprekersdiarisatie en woord-voor-woord timestamps.
- Voxtral Realtime – een speciaal model voor live toepassingen dat audio direct omzet terwijl het binnenkomt, met een configureerbare vertraging tot minder dan 200 milliseconden.
Beide modellen ondersteunen 13 talen, waaronder Nederlands, Engels, Frans, Arabisch en Japans, wat ze zeer geschikt maakt voor wereldwijde toepassingen.
Snelheid, nauwkeurigheid en kosten
Mistral legt de lat hoog: de nieuwe modellen combineren state-of-the-art transcriptie-kwaliteit met efficiëntie en een lage foutmarge. Volgens hun eigen benchmarks haalt Voxtral Mini Transcribe V2 een van de laagste woordfoutpercentages in de industrie, terwijl het ook goedkoper is dan concurrenten.
Zo kunnen organisaties audio tot 3 uur lang verwerken in één verzoek en dankzij de ingebouwde diarisation precies zien wie wat heeft gezegd en wanneer – een enorme meerwaarde voor meetings, interviews of klantgesprekken.
Enterprise-klaar met privacy-opties
Voxtral Realtime wordt geleverd met open weights onder de Apache 2.0-licentie, wat betekent dat bedrijven het model lokaal kunnen draaien – bijvoorbeeld op laptops of servers – zonder gevoelige audio naar externe cloudservers te sturen. Dit is een belangrijke troef voor sectoren met strenge privacy-eisen zoals gezondheidszorg, financiën of overheid.
Daarnaast bevat het platform features zoals context biasing (voor betere herkenning van specifieke terminologie) en noise robustness voor onstabiele opnameomgevingen.
Direct testen via Mistral Studio
Gebruikers kunnen de kracht van Voxtral Transcribe 2 meteen ervaren via een nieuw audio-playground in Mistral Studio. Hier kun je audio uploaden, diarisation aanzetten, timestamps beheren en contextuele woordenlijsten toevoegen, allemaal binnen een gebruiksvriendelijke interface.
Wat betekent dit voor de toekomst van spraak-AI?
Met de release van Voxtral Transcribe 2 zet Mistral AI een duidelijke koers uit in het snel evoluerende spraak-naar-tekst landschap. Door realtime transcriptie met lage latentie, uitgebreide taalondersteuning en open-source-opties te combineren, versterkt het Franse bedrijf zijn positie als alternatief voor de grote techspelers uit de VS, terwijl het tegelijkertijd tegemoetkomt aan de groeiende vraag naar privacy-bewuste AI-oplossingen.









