AWS เปิดตัว Amazon SageMaker HyperPod สำหรับเทรน AI ขนาดใหญ่

AWS เปิดตัว Amazon SageMaker HyperPod สำหรับเทรน AI ขนาดใหญ่

Credit: AWS

Amazon Web Services (AWS) ประกาศเปิดตัวบริการ Amazon SageMaker HyperPod บริการสำหรับเทรน Foundation Models (FMs) ขนาดใหญ่เพื่อช่วยลดระยะเวลาในการเทรน โดยมีการใช้งาน Infrastucture ที่ปรับแต่งขึ้นมาโดยเฉพาะในการทำ Distributed Training นักพัฒนาสามารถสั่งให้ SageMake HyperPod ทำการเทรน FMs ได้แบบอัตโนมัติ โดยมีระบบ Cluster Health Monitoring ช่วยในการตรวจสอบ และยังมีระบบ Automated node resiliency เพื่อช่วยในการเปลี่ยน node ที่เสียหาย และสั่งให้ทำการเทรน FMs ต่อได้เอง นอกจากนี้นักพัฒนายังสามารรถเชื่อมต่อ Frameworks, debugging toos และ Library อื่นๆจากภายนอกเข้าไปได้อีกด้วย บริการนี้ช่วยลดระยะเวลาในการเทรน AI Model ได้สูงสุด 40%

ปัจจุบัน Amazon SageMaker เปิดให้ใช้งานในหลาย Region แล้ว ได้แก่ US East (Ohio), US East (N. Virginia), US West (Oregon), Asia Pacific (Singapore), Asia Pacific (Sydney), Asia Pacific (Tokyo), Europe (Frankfurt), Europe (Ireland), และ Europe (Stockholm)

ที่มา: https://aws.amazon.com/blogs/aws/introducing-amazon-sagemaker-hyperpod-a-purpose-built-infrastructure-for-distributed-training-at-scale/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่ Cupertino, CA แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

AMD และพันธมิตรร่วมกันยกระดับประสบการณ์ที่ขับเคลื่อนด้วย AI บนผลิตภัณฑ์ AMD [PR] 

AMD ประกาศเปิดตัว Amuse 3.0 และโมเดล Stable Diffusion ใหม่ที่ปรับแต่งสำหรับการใช้งานบน AMD ซึ่งเป็นส่วนหนึ่งของความร่วมมือด้านวิศวกรรมกับ Stability AI

AMD เปิดตัวการ์ดเน็ตเวิร์กระดับ 400Gbps ตัวแรกของโลกที่เปิดให้โปรแกรมเองได้

AMD Pollara 400 หรือโซลูชัน NIC ใหม่จาก AMD ซึ่งจุดเด่นคือการเปิดให้มีการโปรแกรมการใช้งานเพิ่มเองได้ และรองรับมาตรฐานจาก Ultra Ethernet Consortium (UEC) ได้ด้วย