OpenAI investe 10 mld nei chip Cerebras per potenziare ChatGPT

OpenAI ha firmato un accordo pluriennale con Cerebras Systems, azienda californiana specializzata in chip per l’intelligenza artificiale, per l’acquisto di fino a 750 megawatt di capacità di calcolo nei prossimi tre anni. Il contratto, del valore complessivo superiore ai 10 miliardi di dollari, punta a sostenere la crescita di ChatGPT e degli altri modelli AI sviluppati da OpenAI.

La diffusione di modelli generativi come ChatGPT sta facendo crescere rapidamente il carico di calcolo necessario per l’elaborazione delle richieste degli utenti. A differenza della fase di addestramento, l’inference richiede infrastrutture sempre disponibili e scalabili, perché ogni interazione comporta l’esecuzione del modello in tempo reale.

Secondo fonti vicine all’operazione, si tratta di uno degli accordi più importanti mai siglati nel settore dell’AI computing, e conferma la strategia di Sam Altman di rafforzare l’infrastruttura fisica necessaria per supportare modelli sempre più sofisticati.

Focus su inference, ragionamento e latenze ridotte

I sistemi di Cerebras verranno utilizzati in particolare per le attività di inference (ossia l’elaborazione in tempo reale delle richieste degli utenti) e per i modelli di ragionamento più avanzati, che richiedono tempi di calcolo superiori rispetto alle query tradizionali.

Con l’aumento dell’uso quotidiano dei modelli linguistici, l’inference è diventata una delle principali fonti di consumo computazionale nel settore AI. Ogni risposta generata comporta l’elaborazione di grandi reti neurali, rendendo la capacità di calcolo e l’efficienza hardware fattori determinanti per costi e prestazioni.

Secondo il CEO di Cerebras, Andrew Feldman, i primi contatti con OpenAI risalgono all’estate scorsa, quando i modelli open source dell’azienda sono stati testati con successo su architetture Cerebras, dimostrando prestazioni competitive rispetto alle GPU tradizionali.

Data center dedicati e rollout progressivo

Come parte dell’accordo, Cerebras costruirà o affitterà data center equipaggiati con chip proprietari, che verranno poi messi a disposizione di OpenAI tramite servizi cloud. L’infrastruttura sarà attivata in più fasi, con piena operatività prevista entro il 2028.

OpenAI punta a migliorare la velocità di risposta dei suoi modelli, riducendo la latenza percepita dagli utenti e aumentando la capacità di elaborare task complessi in tempo reale.

Potenza di calcolo: il nuovo vantaggio competitivo

La firma di questo accordo mette in evidenza il nuovo asset strategico nell’economia dell’AI: la potenza di calcolo su larga scala. L’inference sta diventando uno dei principali colli di bottiglia per l’adozione di modelli avanzati, con impatti diretti su prestazioni, costi e accessibilità.

L’emergere di fornitori alternativi alle GPU tradizionali riflette la crescente domanda di hardware specializzato per l’AI. Architetture come quelle di Cerebras sono progettate per gestire modelli di grandi dimensioni con elevata efficienza energetica e bassa latenza, caratteristiche cruciali per i servizi AI su larga scala.

Per Cerebras, la partnership rappresenta un’occasione per diversificare il portafoglio clienti e aumentare la visibilità dei ricavi, anche in vista di un possibile ritorno sui mercati finanziari.

Cerebras verso l’IPO grazie al contratto OpenAI

Fondata nel 2015, Cerebras è nota per i suoi chip “wafer-scale”, progettati per accelerare training e inference di modelli AI di grandi dimensioni. L’azienda compete direttamente con colossi come Nvidia e AMD nel segmento hardware per AI.

Dopo aver ritirato un primo tentativo di quotazione nel 2024, Cerebras starebbe preparando una nuova IPO. Il contratto decennale con OpenAI fornisce una base solida per attrarre investitori e costruire fiducia sui flussi di cassa futuri.

OpenAI e l’espansione da 1.400 miliardi di dollari

In parallelo, OpenAI continua a espandere la propria infrastruttura. Il CEO Sam Altman ha dichiarato che l’azienda mira a investire fino a 1.400 miliardi di dollari per sviluppare 30 gigawatt di capacità computazionale, l’equivalente del consumo di energia di milioni di abitazioni.

L’obiettivo di espandere la capacità computazionale su scala gigawatt evidenzia quanto l’AI stia diventando un’infrastruttura industriale ad alta intensità energetica e hardware. Con l’aumento degli utenti e delle applicazioni, la disponibilità di calcolo sta emergendo come uno dei principali limiti alla crescita dei servizi AI.

Questo piano, che include l’accordo con Cerebras, è parte della visione a lungo termine di costruire un ecosistema completo che vada oltre il software, includendo hardware, data center e supply chain verticalizzata.

Tra espansione e rischio di bolla AI

Sebbene le prospettive restino ambiziose, alcuni analisti avvertono che la velocità con cui crescono gli investimenti e le valutazioni nel settore AI potrebbe generare dinamiche speculative analoghe alla bolla dot-com dei primi anni 2000.

Il contratto OpenAI-Cerebras segna comunque un punto di svolta: nel nuovo scenario, chi controlla la capacità computazionale controlla anche il ritmo dell’innovazione.