AWS ประกาศรายละเอียด Project Rainier คลัสเตอร์ประมวลผล AI ที่ใช้ชิป AWS Trainium2 จำนวนหลายแสนตัว สำหรับรองรับการพัฒนา AI ของ Anthropic
AWS เปิดเผยรายละเอียดของ Project Rainier ซึ่งเป็นคลัสเตอร์คอมพิวเตอร์ที่ขับเคลื่อนด้วยชิป AWS Trainium2 ที่พัฒนาขึ้นเองจำนวนหลายแสนตัว โดยมีวัตถุประสงค์เพื่อสนับสนุนการพัฒนา AI ของ Anthropic ซึ่ง Amazon ได้ลงทุนไปแล้วกว่า 8 พันล้านดอลลาร์ตั้งแต่เดือนกันยายนที่ผ่านมา
ชิป Trainium2 มาพร้อมกับ NeuronCore 8 แกน โดยแต่ละแกนประกอบด้วยโมดูลประมวลผล 4 ตัว และมีหน่วยความจำ HBM ขนาด 96 GB ชิปทั้งหมดถูกจัดวางในเซิร์ฟเวอร์ที่เรียกว่า Trn2 UltraServer โดยแต่ละเครื่องมีชิป Trainium2 จำนวน 64 ตัว สามารถประมวลผลได้ถึง 332 petaflops เมื่อทำงานกับการคำนวณแบบ sparse FP8
AWS วางแผนติดตั้งเซิร์ฟเวอร์กระจายตามศูนย์ข้อมูลหลายแห่ง พร้อมใช้เทคโนโลยี Elastic Fabric Adapter ที่พัฒนาขึ้นเองเพื่อลดความหน่วงในการส่งข้อมูลระหว่างชิป โดยคาดว่า Project Rainier จะแล้วเสร็จในปีหน้า และจะมีประสิทธิภาพมากกว่าระบบที่ Anthropic ใช้งานอยู่ในปัจจุบันถึง 5 เท่า