Alibaba onthult Qwen3-Next: AI kosten omlaag, snelheid omhoog

maandag, 15 september 2025
Ivan Jans

Alibaba heeft gisteren Qwen3-Next gepresenteerd, een gloednieuw AI-model dat belooft veel krachtiger én veel zuiniger te zijn dan zijn voorgangers. Welke gevolgen zal dit hebben voor de race om AI-dominantie?

Wat is Qwen3-Next?

Qwen3-Next is een recent vrijgegeven taalmodel van Alibaba, onderdeel van de Qwen3-familie. Het belangrijkste kenmerk is dat het 80 miljard parameters bevat, maar slechts een klein deel daarvan wordt geactiveerd tijdens gebruik — ongeveer 3 miljard — wat zorgt voor een flinke besparing aan rekenkracht.

How Alibaba builds its most efficient AI model to date

The new mechanism has sparked excitement among AI experts, who are increasingly concerned about the rising costs of scaling up models.

Mixture-of-Experts met hoge sparsity

Alibaba gebruikt een “Mixture of Experts”-structuur (MoE), waarbij er 512 experts zijn, maar per taak of prompt slechts ~10 experts actief zijn plus één gedeelde expert. Zo blijven resources behouden zonder veel verlies van prestaties.

Qwen3-Next: A New Generation of Ultra-Efficient Model Architecture Unveiled

Alibaba has launched Qwen3-Next, a brand-new model architecture optimized for long-context understanding, large parameter scale, and unprecedented

Hybride aandacht en lange contexten

Er is een hybride attentie-mechanisme geïmplementeerd (hybrid attention) dat efficiënter omgaat met zeer lange sequenties tekst (“context lengths”). Qwen3-Next kan lange contexten van bijvoorbeeld 32.000 tokens (of zelfs meer) aan, wat vooral nuttig is voor documenten, uitgebreide gesprekken of analyses over lange teksten.

China's NEW Qwen3 Next is INSANE (FREE!)

Verbeteringen in stabiliteit en trainingskosten

Door slimme aanpassingen — zoals betere normalisatietechnieken, aangepaste routers in MoE-lagen en gewichtafname (weight decay) bij sommige lagen — lukt het Alibaba om het model stabieler te trainen en toch de kosten sterk te verlagen. Bij vergelijking met Qwen3-32B kost de training van Qwen3-Next minder dan 10 % van de kosten.

Prestaties en vergelijkingen

Qwen3-Next-80B-A3B (de “base” versie) presteert op veel benchmarks even goed of beter dan het oudere Qwen3-32B-model, ondanks dat het substantieel minder resources gebruikt.
Bij contexten van meer dan 32.000 tokens biedt Qwen3-Next een meer dan tienvoudige verhoging in doorvoer(throughput) vergeleken met Qwen3-32B.
In de “thinking”-variant blinkt het model uit in complexere redeneringstaken, en wordt het vergeleken met andere topmodellen zoals Gemini-2.5-Flash.

Qwen3 Next - Behind the Curtain

Toepassingen en toegang

Alibaba maakt Qwen3-Next beschikbaar via platforms als Hugging Face, ModelScope, en via Alibaba Cloud services. Er zijn verschillende varianten: Base, Instruct (gericht op interactief gebruik), en Thinking (gericht op geavanceerd redeneren).

Wat betekent dit voor de AI-race?

Met Qwen3-Next zet Alibaba een stap die misschien minder sterk zichtbaar is dan “bigger is better”, maar op het vlak van efficiëntie en praktische bruikbaarheid mogelijk meer impact kan hebben. Goedkopere trainingskosten, minder benodigde hardware, betere prestaties bij lange tekst — dit kan deuren openen voor meer toepassingen in landen of organisaties die niet beschikken over enorme compute-capaciteit.

Mogelijke uitdagingen en kritische kanttekeningen

Hoewel slechts een deel van de parameters actief is, blijft het bouwen en deployen van zo’n model technisch complex.
Lange contexten vragen niet alleen rekenkracht, maar ook dat de kwaliteit over die lange afstanden behouden blijft — dat moet steeds opnieuw gevalideerd worden.
Open source licenties (Apache 2.0) geven veel vrijheid, maar met grote AI-modellen komen ook ethische en veiligheidsvragen.

Alibaba’s Qwen3-Next is een strategische zet: niet alleen om te concurreren met de giganten zoals OpenAI en Google, maar om te laten zien dat slimme architectuur, efficiëntie, en schaalbaar gebruik hand in hand kunnen gaan met hoge prestaties. Voor ontwikkelaars, bedrijven en onderzoekers kan dit model een waardevolle keuze zijn, zeker wanneer resources of kosten een beperkende factor zijn.

Alibaba onthult Qwen3-Next: AI kosten omlaag, snelheid omhoog

Wat is Qwen3-Next?

How Alibaba builds its most efficient AI model to date

Mixture-of-Experts met hoge sparsity

Qwen3-Next: A New Generation of Ultra-Efficient Model Architecture Unveiled

Hybride aandacht en lange contexten

Verbeteringen in stabiliteit en trainingskosten

Prestaties en vergelijkingen

Toepassingen en toegang

Wat betekent dit voor de AI-race?

Mogelijke uitdagingen en kritische kanttekeningen

Aanbevolen voor jou

TRENDING DEZE MAAND

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Inschrijven Nieuwsbrief

Kies voor een UP-TO-DATE AI Website 100% in Google

UP-TO-DATE WebDesign BV

UP-TO-DATE AI Today

Voor u aanbevolen

Wat is Qwen3-Next?

How Alibaba builds its most efficient AI model to date

Mixture-of-Experts met hoge sparsity

Qwen3-Next: A New Generation of Ultra-Efficient Model Architecture Unveiled

Hybride aandacht en lange contexten

Verbeteringen in stabiliteit en trainingskosten

Prestaties en vergelijkingen

Toepassingen en toegang

Wat betekent dit voor de AI-race?

Mogelijke uitdagingen en kritische kanttekeningen

Aanbevolen voor jou

TRENDING DEZE MAAND

26 technologische trends voor 2026: De complete gids voor ondernemers

Vacature Ervaren B2B Sales | Regio Limburg, VL-brabant, Kempen en Antwerpen

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Inschrijven Nieuwsbrief

Kies voor een UP-TO-DATE AI Website 100% in Google

UP-TO-DATE WebDesign BV

UP-TO-DATE AI Today

Voor u aanbevolen