AMD ประกาศเปิดตัว Instinct MI350 Series accelerators สำหรับ AI และ HPC พร้อมประสิทธิภาพ compute เพิ่มขึ้น 4 เท่าจากรุ่นก่อน และความสามารถ inference เพิ่มขึ้น 35 เท่า โดยได้รับการสนับสนุนจาก Meta, OpenAI, Microsoft และ Oracle ในการใช้งานจริง
AMD ได้เปิดตัว Instinct MI350 Series GPUs ในงาน Advancing AI 2025 ซึ่งประกอบด้วย MI350X และ MI355X ที่ออกแบบมาเพื่อรองรับ generative AI และ high-performance computing โดยมีความสามารถ AI compute เพิ่มขึ้น 4 เท่าเมื่อเทียบกับรุ่นก่อนหน้า และประสิทธิภาพ inference ที่เพิ่มขึ้นถึง 35 เท่า สำหรับรุ่น MI355X ยังให้ประสิทธิภาพต่อค่าใช้จ่ายที่ดีกว่า สามารถสร้าง tokens มากขึ้น 40% ต่อดอลลาร์เมื่อเทียบกับคู่แข่ง ทำให้เหมาะสำหรับองค์กรที่ต้องการประสิทธิภาพสูงในการรัน AI workloads ขนาดใหญ่
นอกจากฮาร์ดแวร์แล้ว AMD ยังนำเสนอโครงสร้างพื้นฐาน rack-scale AI แบบ open standards ที่รวม MI350 Series accelerators, 5th Gen AMD EPYC processors และ AMD Pensando Pollara NICs เข้าด้วยกัน ซึ่งกำลังถูกนำไปใช้งานใน hyperscaler deployments อย่าง Oracle Cloud Infrastructure (OCI) และจะพร้อมใช้งานในวงกว้างช่วงครึ่งหลังของปี 2025 พร้อมกันนี้ยังได้แสดงตัวอย่าง rack รุ่นถัดไปชื่อ “Helios” ที่จะใช้ MI400 Series GPUs ซึ่งคาดว่าจะให้ประสิทธิภาพ inference บน Mixture of Experts models เพิ่มขึ้นถึง 10 เท่า
ด้านซอฟต์แวร์ AMD เปิดตัว ROCm 7 ที่ปรับปรุงใหม่เพื่อรองรับ generative AI workloads ที่ซับซ้อนมากขึ้น โดยเพิ่มการรองรับ framework มาตรฐานอุตสาหกรรม ขยายความเข้ากันได้กับฮาร์ดแวร์ และเพิ่มเครื่องมือพัฒนาใหม่ๆ สำหรับ ecosystem ปัจจุบันมีผู้พัฒนา AI รายใหญ่ 7 จาก 10 ราย รวมถึง Meta, OpenAI, Microsoft และ xAI ใช้ Instinct accelerators ในการรัน production workloads โดย Meta ใช้ MI300X สำหรับ Llama 3 และ Llama 4 inference ขณะที่ Microsoft ประกาศว่า MI300X กำลังใช้งานกับทั้ง proprietary และ open-source models บน Azure ส่วน Oracle Cloud Infrastructure จะเป็นหนึ่งในผู้นำที่นำ rack-scale AI infrastructure ใหม่ของ AMD ไปใช้งาน พร้อมเสนอ zettascale AI clusters ที่มี MI355X GPUs สูงสุด 131,072 ตัว