Hoe IBM met AI Optimizer for Z 2.1 generatieve AI laten draaien op mainframes

dinsdag, 16 december 2025
Ivan Jans

De kern: AI in de mainframe-wereld — sneller, slimmer, efficiënter

In november 2025 lanceerde IBM een nieuwe versie van zijn “AI Optimizer for Z”: versie 2.1. Daarmee wil IBM een belangrijke hindernis slechten voor ondernemingen die generatieve AI (GenAI) en LLM-toepassingen willen integreren op mainframe-infrastructuren — namelijk: latency, resource-efficiëntie, compliance en infrastructuurcomplexiteit.

Voor bedrijven die al draaien op IBM Z is de vraag niet óf ze AI kunnen inzetten, maar hoe vlot, veilig en kostenefficiëntze dat kunnen doen zonder hun bestaande workflows te verstoren. AI Optimizer for Z 2.1 is daar expliciet op afgestemd.

Scale and optimize gen AI inferencing using the new AI Optimizer for Z 2.1

The AI Optimizer for Z 2.1 is designed to serve AI models and perform inference optimization on IBM Spyre accelerator.

Wat AI Optimizer for Z 2.1 concreet toevoegt

Dankzij integratie met bekende tools als Grafana en Prometheus biedt de Optimizer live dashboards. Daardoor krijgen beheerders inzicht in inference-prestaties, hardware- en acceleratorkennis, gebruikspatronen en bottlenecks. Dat maakt overprovisionering overbodig en helpt bij budgettering en infrastructuurplanning.

Multi-level caching: sneller, efficiënter, schaalbaarder

De nieuwe versie ondersteunt caching op meerdere niveaus. Via key-value caching (voor veelvoorkomende tokenreeksen) en gedeelde cache over meerdere LLM-deployments kan inference veel sneller verlopen. Dat leidt tot lagere “time-to-first-token”, hogere doorvoer en efficiënter gebruik van hardware.

Slimme routing & automatische detectie voor LLM’s op Spyre

LLM’s die draaien op de gespecialiseerde accelerator Spyre accelerator worden automatisch herkend en geoptimaliseerd. Via een “intelligente router” kan AI Optimizer requests verdelen op basis van beschikbaarheid, performance en gebruik — en LLM’s groeperen volgens tags (vb. conform OpenAI-API standaarden).

Hybride AI-infrastructuur: externe modellen integreren

Niet alleen lokale LLM’s: ook modellen die elders draaien — buiten IBM Z of LinuxONE — kunnen geregistreerd worden. Zo krijgen bedrijven één uniforme inferencing-laag, met gedeelde monitoring, tagging en load balancing. Ideaal voor hybride cloud- en on-prem AI-architecturen.

Waarom dit relevant is voor bedrijven

Veel organisaties hanteren strenge latency-, compliance- of data-residency-vereisten — inference moet dicht bij de data gebeuren, op het mainframe. AI Optimizer maakt dat praktisch mogelijk, zonder performance-opoffering.
AI-modellen worden steeds zwaarder en veeleisender. Door caching, optimalisatie en slimme resource-toewijzing kunnen bedrijven AI-workloads schalen zonder knelpunten of onevenredige kosten.
Voor organisaties met legacy-infrastructuur — waar data, transacties en compliance cruciaal zijn — is dit een manier om veilig en compliant AI te omarmen, zonder massale migraties of cloud-afhankelijkheid.

AI on mainframe — geen hype, maar strategische infrastructuur

Met AI Optimizer for Z 2.1 toont IBM dat generatieve AI niet per se in de cloud hoeft te leven. Voor ondernemingen die zĳn gebouwd op mainframes zoals IBM Z of LinuxONE, biedt de software een betrouwbare, efficiënte en schaalbare manier om AI toe te voegen — mét behoud van controle, compliance en prestatie-zekerheid. Het is een slimme brug tussen legacy infrastructuur en next-gen AI-ambities.

Hoe IBM met AI Optimizer for Z 2.1 generatieve AI laten draaien op mainframes

De kern: AI in de mainframe-wereld — sneller, slimmer, efficiënter

Scale and optimize gen AI inferencing using the new AI Optimizer for Z 2.1

Wat AI Optimizer for Z 2.1 concreet toevoegt

Multi-level caching: sneller, efficiënter, schaalbaarder

Slimme routing & automatische detectie voor LLM’s op Spyre

Hybride AI-infrastructuur: externe modellen integreren

Waarom dit relevant is voor bedrijven

AI on mainframe — geen hype, maar strategische infrastructuur

Aanbevolen voor jou

TRENDING DEZE MAAND

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Inschrijven Nieuwsbrief

Kies voor een UP-TO-DATE AI Website 100% in Google

UP-TO-DATE WebDesign BV

UP-TO-DATE AI Today

Voor u aanbevolen

De kern: AI in de mainframe-wereld — sneller, slimmer, efficiënter

Scale and optimize gen AI inferencing using the new AI Optimizer for Z 2.1

Wat AI Optimizer for Z 2.1 concreet toevoegt

Multi-level caching: sneller, efficiënter, schaalbaarder

Slimme routing & automatische detectie voor LLM’s op Spyre

Hybride AI-infrastructuur: externe modellen integreren

Waarom dit relevant is voor bedrijven

AI on mainframe — geen hype, maar strategische infrastructuur

Aanbevolen voor jou

TRENDING DEZE MAAND

71% van de mensen schat zijn AI-skills verkeerd in, zegt Stanford-expert

Google onthult: Zo bouw je schaalbare AI-systemen

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Inschrijven Nieuwsbrief

Kies voor een UP-TO-DATE AI Website 100% in Google

UP-TO-DATE WebDesign BV

UP-TO-DATE AI Today

Voor u aanbevolen