Project Rainier: la nuova vetta dell’AI firmata AWS | | | | Turtles AI

Project Rainier: la nuova vetta dell’AI firmata AWS
Un cluster da record con oltre 400.000 chip Trainium 2 ridefinisce la scala dell’elaborazione AI, combinando potenza, efficienza energetica e infrastruttura proprietaria per addestrare i modelli del futuro
Isabella V25 giugno 2025

 


AWS sta costruendo Project Rainier, un gigantesco cluster EC2 UltraCluster con oltre 400 000 chip Trainium 2 distribuiti in vari data center statunitensi. Progettato per addestrare modelli AI frontier come Claude con potenze di calcolo esaflop e rete ad alta efficienza.

Punti chiave:

  • Cluster EC2 UltraCluster con decine di migliaia di UltraServer, ciascuno con 64 chip Trainium 2 collegati via NeuronLink.
  • Capacità computazionale cinque volte superiore all’attuale più grande cluster di Anthropic.
  • Architettura distribuita in più data center, dotata di rete NeuronLink e Elastic Fabric Adapter (EFA) per latenza minima.
  • Trainium 2 offre fino a 4× le prestazioni della generazione precedente e un rapporto prezzo/prestazioni 30‑40% migliore rispetto ai GPU AWS P5.

AWS ha progettato Project Rainier come un’architettura modulare e distribuita, con UltraServer che integrano quattro Trn2 instance in un unico nodo fisico: 64 chip Trainium 2 connessi via NeuronLink, offrendo fino a 332 petaflop per node in operazioni FP8 sparse. La decisione di distribuire il cluster su più siti solleva la complessità ingegneristica, ma ottimizza l’accesso a energia, raffreddamento e scalabilità.

Anthropic, grazie a un investimento AWS di 8 miliardi di dollari, utilizzerà Rainier per la formazione dei suoi modelli Claude — con un aumento di potenza di calcolo di cinque volte rispetto al suo cluster esistente. L’adozione di Trainium 2 – già testato internamente anche da Apple – punta a ridurre la dipendenza da Nvidia, offrendo prestazioni competitive con costi inferiori.

La roadmap tecnologica AWS include Trainium 3, in arrivo nel 2025: promette un raddoppio delle prestazioni e un’efficienza energetica aumentata del 40‑50%. Questo fa parte di una strategia di integrazione verticale, in cui AWS controlla hardware (chip e server), networking (NeuronLink, EFA) e data center, per ottimizzare costi, performance e sostenibilità.

Grazie a design proprietari di alimentazione, raffreddamento e materiali da costruzione, i nuovi data center riducono energia meccanica fino al 46% e l’uso di acqua per kWh scende a 0,15 L, meno della metà della media del settore.

Project Rainier rappresenta un paradigma su cui AWS punta a costruire capacità di calcolo su scala esaflop, semplificando operazioni complesse e promuovendo efficienza e indipendenza tecnologica.

Una piattaforma emergente che conferma come il calcolo AI su larga scala stia diventando infrastruttura critica per il futuro dell’AI.

 

Video