IBM introduceert Granite 4.0: Een hybride AI-model met passie voor efficiëntie

zaterdag, 11 oktober 2025
Ivan Jans

Een nieuwe stap in taalmodellering

IBM heeft recent de Granite 4.0-familie gelanceerd — een reeks taalmodellen die open, krachtig en geoptimaliseerd zijn voor zakelijk gebruik. De eerste variant die publiek werd vrijgegeven is de zogeheten Tiny Preview — een compacte uitvoering die efficiency combineert met indrukwekkende prestaties.

Granite | IBM

Start building with Granite 4.0, our family of open, performant and trusted AI models, tailored for business and optimized to scale your AI applications.

https://www.ibm.com

Efficiëntie als kernprincipe

Waar voorgaande modellen vaak moeilijk schaalbaar waren in geheugengebruik, zet Granite 4.0 in op een hybride architectuur: een combinatie van Mamba-2-achtige lagen en traditionele transformerlagen. Door deze mix stijgt de efficiëntie en daalt het geheugenverbruik zonder dat de kwaliteit sterk lijdt.

In de Tiny-variant gaat het om 7 miljard parameters, maar slechts 1 miljard parameters zijn “actief” tijdens inference. Deze sparsity draagt sterk bij aan het lagere gebruik van rekenkracht per taak.

This week in AI models: Granite 4.0, Claude 4.5, Sora 2

Lange context, geen beperkingen

Een van de innovatieve keuzes is het gebruik van NoPE (No Positional Encoding), waardoor het model contextuele informatie behandelt zonder vaste positiesymbolen. Dit helpt bij het verwerken van zeer lange tekstpassages — tot 128K tokens zijn al gevalideerd. In hun tests is gebleken dat het model zich goed houdt, zelfs met zeer uitgebreide input-reeksen.

Prestaties die verrassen

Ondanks zijn compacte opzet behaalt Granite 4.0 Tiny al sterke resultaten op benchmarks. Zo presteert het model beter dan eerdere versies op taken als reasoning, langtekstanalyse en instructiegebaseerde opdrachten. Bovendien is de instruct-variant meertalig en geoptimaliseerd voor dialoogtoepassingen. De publicatie van de modelgewichten onder de Apache 2.0-licentie benadrukt IBM’s streven naar openheid en toegankelijkheid.

Waarom deze stap er toe doet

Voor ondernemingen betekent Granite 4.0 dat krachtige AI niet langer gebonden is aan extreme hardware. Door het ontwerp kan het draaien op minder krachtige GPU’s, zelfs in scenario’s met lange context en meerdere gelijktijdige sessies. Deze verschuiving maakt AI-integratie toegankelijker voor organisaties die grootse plannen hebben, maar beperkte middelen.

IBM Granite 4.0 First Look & Testing – IBM’s New Open Source Models!

Kritiek en uitdagingen

Hoewel de prestaties veelbelovend zijn, is het belangrijk op te merken dat de Tiny-preview nog niet de definitieve versie is — sommige onderdelen zijn nog in ontwikkeling. Sommige benchmarkresultaten liggen nog achter modellen die geen nadruk leggen op efficiëntie, maar op puur vermogen. Ook blijft de werkelijke effectiviteit in grootschalige, real-world toepassingen nog af te wachten.