AWS ประกาศพร้อมใช้งาน EC2 สำหรับงานด้าน Machine Learning ขนาดใหญ่ ‘Trn1’

Trn1 instance เป็นบริการใหม่จาก AWS ที่ออกแบบมาสำหรับงานประมวลผลด้าน Machine Learning ขนาดใหญ่โดยอาศัยชิปประมวลผล Trainium ที่ถูกออกแบบโดย AWS เอง

Trn1 ถูกประกาศออกมาตั้งแต่งาน re:Invent 2021 แล้วให้ทดลอง ซึ่งวันนี้เพิ่งประกาศเปิดความพร้อมใช้งาน ความพิเศษอย่างแรกคือชิป Trainium เป็นชิปพิเศษสำหรับงาน Deep Learning ทรประสิทธิภาพและเป็นรุ่นที่สองต่อจากชิป AWS Inferentia โดย Trn1 มีให้เลือก 2 รุ่นขนาดสูงสุดที่ 128 vCPU นอกจากนี้ยังโดดเด่นเรื่องของการประมวลผล TF32/FP16/BF16 ได้ถึง 3.4 PetaFLOPS ที่ภายในเครือข่ายของชิปคุยกันได้ผ่าน NeuronLink เพื่อเลี่ยงเป็นคอขวด ในขณะที่ระดับเครือข่ายก็ไม่น้อยหน้าผ่าน Elastic Fabric Adapter มีแบนวิดธ์สูงถึง 800 Gbps 

สำหรับการเทรนข้อมูลขนาดใหญ่ Trn1 ได้เชื่อมต่อกับ Storage ประสิทธิภาพสูงอย่าง Amazon FSx for Lustre โดย Trn1 จะอยู่ในคลัสเตอร์ที่ AWS เรียกว่าเป็น ‘UltraCluster’ โดยภายในติดต่อกันด้วยความเร็วสูงรองรับโมเดลการใช้งานที่ซับซ้อน ยังมีความโดดเด่นในเทคโนโลยีของ Trainium อย่าง การรองรับชนิดของข้อมูลได้หลากหลายทั้ง FP32/TF32,BF16,FP16 และ UNIT8 รวมถึงมีการปรับจูนการทำ Stochastic Rounding ระดับฮาร์ดแวร์ ที่สำคัญยังใช้ Neuron SDK เหมือนกับ AWS Inferentia ทำให้ไม่ต้องปรับตัวกับองค์ความรู้ใหม่

ผู้สนใจ Trn1 สามารถเข้าถึงบริการได้ที่ AWS US East (N. Virginia) และ US West (Oregon) ในหลายรูปแบบทั้ง On-demand, Reserved และ Spot Instance

ที่มา : https://aws.amazon.com/blogs/aws/amazon-ec2-trn1-instances-for-high-performance-model-training-are-now-available/

About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้