OpenAI en Cerebras: Supersnelle alliantie om AI-respons te versnellen

OpenAI en Cerebras: Supersnelle alliantie om AI-respons te versnellen

OpenAI heeft een nieuwe strategische samenwerking aangekondigd met chipmaker Cerebras om zijn AI-infrastructuur flink te verbeteren. Met de toevoeging van 750 megawatt aan ultra-lage-latentie rekencapaciteit wil OpenAI de responstijden van zijn modellen drastisch versnellen — een stap die de manier waarop AI met mensen omgaat kan transformeren. 

Waarom deze samenwerking belangrijk is

Cerebras staat bekend om zijn speciale AI-systemen die enorme rekenkracht, geheugen en bandbreedte samenbrengen op één gigantische chip. In tegenstelling tot traditionele hardware, die vaak bottlenecks kent tijdens inference-taken, moet het ontwerp van Cerebras deze beperkingen vermijden. 

 

OpenAI is partnering with Cerebras to add 750MW of ultra low-latency AI compute to the platform.

https://openai.com

Door deze technologie te integreren, wil OpenAI zijn AI-modellen — zoals ChatGPT — sneller laten reageren op complexe vragen, code-generatie, beeldcreatie en andere intensieve taken. Snellere reacties betekenen dat gebruikers meer kunnen doen, langer met de tools werken en zwaardere workloads kunnen uitvoeren zonder merkbare vertraging. 

Wat cerebrale rekensystemen zo speciaal maakt

Cerebras’ aanpak draait om snelheid. Hun “wafer-scale” systemen combineren rekenkracht, geheugen en data-verkeer op een schaal die traditionele GPU’s niet kunnen evenaren. Dit moet AI-responders in staat stellen om realtime inferentie— het verwerken van gebruikersverzoeken — naar een nieuw niveau te tillen. 

Volgens OpenAI is het doel om deze nieuwe capaciteit in fases te integreren binnen hun inference-stack. Hierdoor kan de infrastructuur worden opgeschaald naarmate meer vraag ontstaat en nieuwe workloads worden ondersteund. 

Wat de leiders zeggen

Sachin Katti, verantwoordelijk voor infrastructuur bij OpenAI, benadrukt dat het partnerschap met Cerebras een belangrijke stap is om een weerbare en toekomstbestendige compute-portfolio op te bouwen — waarbij elk systeem optimaal is afgestemd op de juiste taken. 

Andrew Feldman, mede-oprichter en CEO van Cerebras, vergelijkt de impact van realtime inferentie op AI met hoe breedbandinternet de vroege webervaring veranderde: “Net zoals breedband het internet transformeerde, zal realtime inferentie AI herdefiniëren en nieuwe manieren mogelijk maken om met modellen te bouwen en te interageren.” 


Wat dit betekent voor de toekomst

De capaciteit van 750MW zal geleidelijk beschikbaar komen tot 2028, waardoor OpenAI zijn AI-infrastructuur stapsgewijs kan uitbreiden. In een sector waarin snelle, betrouwbare reacties essentieel zijn, kan deze samenwerking OpenAI helpen een voorsprong te behouden in de wereldwijde AI-race.

Aanbevolen voor jou

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een UP-TO-DATE AI Website 100% in Google

Een UP-TO-DATE AI Website maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak