OpenAI จับมือ Broadcom และ TSMC พัฒนาชิปสำหรับงานอนุมาน AI โดยเฉพาะ

มีรายงานว่า OpenAI กำลังร่วมมือกับ Broadcom และ TSMC เพื่อพัฒนาและผลิตชิปสำหรับรันโมเดล AI หลังจากเทรนเสร็จแล้ว มุ่งลดการใช้งาน GPU ที่ออกแบบมาสำหรับงานทั่วไปและจัดการกับต้นทุนที่เพิ่มขึ้นตามความต้องการฮาร์ดแวร์เฉพาะทางสำหรับ AI ที่เติบโตอย่างต่อเนื่อง

Credit: ShutterStock

การตัดสินใจของ OpenAI เกิดขึ้นหลังจากที่บริษัทได้พิจารณาทางเลือกหลายทางเพื่อกระจายการจัดหาชิปและลดต้นทุน โดย Reuters รายงานว่าก่อนหน้านี้ OpenAI ได้พิจารณาที่จะระดมทุนสำหรับสร้างโรงงานผลิตชิปเป็นของตัวเอง ทว่าเป็นแผนการที่มีค่าใช้จ่ายสูงและต้องใช้เวลายาวนาน จึงเปลี่ยนมามุ่งเน้นไปที่การออกแบบชิปเพียงอย่างเดียวแทน และร่วมมือกับพันธมิตรอย่าง Broadcom และ TSMC ในฝั่งการผลิต เนื่องจากเป็นแนวทางที่รวดเร็วและมีโอกาสสำเร็จมากกว่าในขณะนี้ อย่างไรก็ตาม บริษัทอาจกลับมาพิจารณาตั้งเครือข่ายโรงงานผลิตของตนเองในอนาคตเช่นกัน

Bloomberg รายงานว่าการตัดสินใจดังกล่าวของ Open AI ไม่ได้ต้องการมาแทนที่ GPU เช่นที่จำหน่ายโดย Nvidia แต่บริษัทต้องการพัฒนาชิปเฉพาะทางสำหรับใช้ในการอนุมาน (inference) ซึ่งเป็นการนำโมเดลที่เทรนเสร็จแล้วมาใช้ในการทำนายหรือการตัดสินใจในข้อมูลใหม่แบบเรียลไทม์ นอกจากนี้รายงานเดียวกันยังระบุว่านักลงทุนและนักวิเคราะห์ต่างก็คาดการณ์ว่าความต้องการชิปที่รองรับการอนุมานจะเพิ่มขึ้น เมื่อบริษัทเทคโนโลยีจำนวนมากขึ้นใช้โมเดล AI สำหรับการทำงานที่ซับซ้อนมากยิ่งขึ้น

การตัดสินใจออกแบบชิปเป็นของตัวเองของ OpenAI เป็นไปตามแนวโน้มของกลุ่มบริษัทเทคโนโลยีรายใหญ่และบริษัท AI ที่พัฒนาฮาร์ดแวร์เฉพาะทางเพื่อรองรับความต้องการของงาน AI ที่ซับซ้อนได้อย่างมีประสิทธิภาพกว่าการใช้ GPU ที่ถูกออกแบบมาสำหรับงานทั่วไป ในปัจจุบัน OpenAI พึ่งพา GPU ของ Nvidia เป็นอย่างมากในการเทรนโมเดล ซึ่งเป็นกระบวนการที่ต้องการพลังการคำนวณมหาศาลเพื่อปรับแต่งอัลกอริทึมด้วยชุดข้อมูลขนาดใหญ่ ทว่าการอนุมานต้องการความสามารถของชิปที่แตกต่างออกไป โดยเน้นไปที่ความเร็วและประสิทธิภาพด้านพลังงานมากกว่า

ที่มา: https://siliconangle.com/2024/10/29/openai-reportedly-working-broadcom-tsmc-develop-custom-ai-inference-chip/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

Nebius ระดมทุน 700 ล้านดอลลาร์ เสริมศักยภาพศูนย์ข้อมูลและบริการ AI

Nebius ผู้ให้บริการโครงสร้างพื้นฐาน AI ระดมทุนได้ 700 ล้านดอลลาร์ผ่านการการเสนอขายหุ้นในวงจำกัด โดยมีนักลงทุนหลัก ได้แก่ Nvidia, Accel และ Orbis Investments

AWS เปิดตัวบริการ Security Incident Response เสริมความแข็งแกร่งด้านความปลอดภัย

AWS ประกาศเปิดตัวบริการใหม่ AWS Security Incident Response สำหรับตรวจจับและแก้ไขการโจมตีทางไซเบอร์ พร้อมให้บริการในงาน AWS re:Invent 2024