AWS เปิดตัว Project Rainier คลัสเตอร์ AI ขนาดใหญ่พร้อมชิป Trainium2 นับแสนตัว

AWS ประกาศรายละเอียด Project Rainier คลัสเตอร์ประมวลผล AI ที่ใช้ชิป AWS Trainium2 จำนวนหลายแสนตัว สำหรับรองรับการพัฒนา AI ของ Anthropic

Credit: AWS

AWS เปิดเผยรายละเอียดของ Project Rainier ซึ่งเป็นคลัสเตอร์คอมพิวเตอร์ที่ขับเคลื่อนด้วยชิป AWS Trainium2 ที่พัฒนาขึ้นเองจำนวนหลายแสนตัว โดยมีวัตถุประสงค์เพื่อสนับสนุนการพัฒนา AI ของ Anthropic ซึ่ง Amazon ได้ลงทุนไปแล้วกว่า 8 พันล้านดอลลาร์ตั้งแต่เดือนกันยายนที่ผ่านมา

ชิป Trainium2 มาพร้อมกับ NeuronCore 8 แกน โดยแต่ละแกนประกอบด้วยโมดูลประมวลผล 4 ตัว และมีหน่วยความจำ HBM ขนาด 96 GB ชิปทั้งหมดถูกจัดวางในเซิร์ฟเวอร์ที่เรียกว่า Trn2 UltraServer โดยแต่ละเครื่องมีชิป Trainium2 จำนวน 64 ตัว สามารถประมวลผลได้ถึง 332 petaflops เมื่อทำงานกับการคำนวณแบบ sparse FP8

AWS วางแผนติดตั้งเซิร์ฟเวอร์กระจายตามศูนย์ข้อมูลหลายแห่ง พร้อมใช้เทคโนโลยี Elastic Fabric Adapter ที่พัฒนาขึ้นเองเพื่อลดความหน่วงในการส่งข้อมูลระหว่างชิป โดยคาดว่า Project Rainier จะแล้วเสร็จในปีหน้า และจะมีประสิทธิภาพมากกว่าระบบที่ Anthropic ใช้งานอยู่ในปัจจุบันถึง 5 เท่า

ที่มา: https://siliconangle.com/2024/12/03/aws-details-project-rainier-ai-compute-cluster-hundreds-thousands-chips/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ