AWS เปิดตัว Project Rainier คลัสเตอร์ AI ขนาดใหญ่พร้อมชิป Trainium2 นับแสนตัว

AWS ประกาศรายละเอียด Project Rainier คลัสเตอร์ประมวลผล AI ที่ใช้ชิป AWS Trainium2 จำนวนหลายแสนตัว สำหรับรองรับการพัฒนา AI ของ Anthropic

Credit: AWS

AWS เปิดเผยรายละเอียดของ Project Rainier ซึ่งเป็นคลัสเตอร์คอมพิวเตอร์ที่ขับเคลื่อนด้วยชิป AWS Trainium2 ที่พัฒนาขึ้นเองจำนวนหลายแสนตัว โดยมีวัตถุประสงค์เพื่อสนับสนุนการพัฒนา AI ของ Anthropic ซึ่ง Amazon ได้ลงทุนไปแล้วกว่า 8 พันล้านดอลลาร์ตั้งแต่เดือนกันยายนที่ผ่านมา

ชิป Trainium2 มาพร้อมกับ NeuronCore 8 แกน โดยแต่ละแกนประกอบด้วยโมดูลประมวลผล 4 ตัว และมีหน่วยความจำ HBM ขนาด 96 GB ชิปทั้งหมดถูกจัดวางในเซิร์ฟเวอร์ที่เรียกว่า Trn2 UltraServer โดยแต่ละเครื่องมีชิป Trainium2 จำนวน 64 ตัว สามารถประมวลผลได้ถึง 332 petaflops เมื่อทำงานกับการคำนวณแบบ sparse FP8

AWS วางแผนติดตั้งเซิร์ฟเวอร์กระจายตามศูนย์ข้อมูลหลายแห่ง พร้อมใช้เทคโนโลยี Elastic Fabric Adapter ที่พัฒนาขึ้นเองเพื่อลดความหน่วงในการส่งข้อมูลระหว่างชิป โดยคาดว่า Project Rainier จะแล้วเสร็จในปีหน้า และจะมีประสิทธิภาพมากกว่าระบบที่ Anthropic ใช้งานอยู่ในปัจจุบันถึง 5 เท่า

ที่มา: https://siliconangle.com/2024/12/03/aws-details-project-rainier-ai-compute-cluster-hundreds-thousands-chips/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่ Cupertino, CA แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

พบช่องโหว่ใน Kubernetes ที่อาจถูกใช้ยึดควบคุม Windows Node

พบช่องโหว่ใน Kubernetes ที่อาจถูกใช้ยึดควบคุม Windows Node ทั้งหมดในคลัสเตอร์

SonicWall เตือนช่องโหว่ Zero-day ใน SMA 1000 ให้ผู้ใช้อัปเดตด่วน!

พบการโจมตีในโซลูชัน SonicWall SMA 1000 Appliance Management Console (AMC) และ Central Management Console (CMC) ที่เป็นโซลูชันสำหรับรวมศูนย์การบริหารจัดการ โดยช่องโหว่มีความร้ายแรงที่ …