AWS ประกาศพร้อมใช้งาน EC2 สำหรับงานด้าน Machine Learning ขนาดใหญ่ ‘Trn1’

October 11, 2022 AI, AWS, Cloud and Systems, Cloud Services, Products

Trn1 instance เป็นบริการใหม่จาก AWS ที่ออกแบบมาสำหรับงานประมวลผลด้าน Machine Learning ขนาดใหญ่โดยอาศัยชิปประมวลผล Trainium ที่ถูกออกแบบโดย AWS เอง

Trn1 ถูกประกาศออกมาตั้งแต่งาน re:Invent 2021 แล้วให้ทดลอง ซึ่งวันนี้เพิ่งประกาศเปิดความพร้อมใช้งาน ความพิเศษอย่างแรกคือชิป Trainium เป็นชิปพิเศษสำหรับงาน Deep Learning ทรประสิทธิภาพและเป็นรุ่นที่สองต่อจากชิป AWS Inferentia โดย Trn1 มีให้เลือก 2 รุ่นขนาดสูงสุดที่ 128 vCPU นอกจากนี้ยังโดดเด่นเรื่องของการประมวลผล TF32/FP16/BF16 ได้ถึง 3.4 PetaFLOPS ที่ภายในเครือข่ายของชิปคุยกันได้ผ่าน NeuronLink เพื่อเลี่ยงเป็นคอขวด ในขณะที่ระดับเครือข่ายก็ไม่น้อยหน้าผ่าน Elastic Fabric Adapter มีแบนวิดธ์สูงถึง 800 Gbps

สำหรับการเทรนข้อมูลขนาดใหญ่ Trn1 ได้เชื่อมต่อกับ Storage ประสิทธิภาพสูงอย่าง Amazon FSx for Lustre โดย Trn1 จะอยู่ในคลัสเตอร์ที่ AWS เรียกว่าเป็น ‘UltraCluster’ โดยภายในติดต่อกันด้วยความเร็วสูงรองรับโมเดลการใช้งานที่ซับซ้อน ยังมีความโดดเด่นในเทคโนโลยีของ Trainium อย่าง การรองรับชนิดของข้อมูลได้หลากหลายทั้ง FP32/TF32,BF16,FP16 และ UNIT8 รวมถึงมีการปรับจูนการทำ Stochastic Rounding ระดับฮาร์ดแวร์ ที่สำคัญยังใช้ Neuron SDK เหมือนกับ AWS Inferentia ทำให้ไม่ต้องปรับตัวกับองค์ความรู้ใหม่

ผู้สนใจ Trn1 สามารถเข้าถึงบริการได้ที่ AWS US East (N. Virginia) และ US West (Oregon) ในหลายรูปแบบทั้ง On-demand, Reserved และ Spot Instance

ที่มา : https://aws.amazon.com/blogs/aws/amazon-ec2-trn1-instances-for-high-performance-model-training-are-now-available/

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้

TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

AWS ประกาศพร้อมใช้งาน EC2 สำหรับงานด้าน Machine Learning ขนาดใหญ่ ‘Trn1’

About nattakon

Related Articles

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

AWS ประกาศพร้อมใช้งาน EC2 สำหรับงานด้าน Machine Learning ขนาดใหญ่ ‘Trn1’

Share this:

About nattakon

Related Articles

Check Also