มีรายงานจาก Wall Street Journal ว่า Nvidia กำลังพัฒนาโปรเซสเซอร์เฉพาะสำหรับงานอินเฟอเรนซ์ ซึ่งจะถูกนำไปใช้โดย OpenAI Group และบริษัทปัญญาประดิษฐ์อื่น ๆ เพื่อพัฒนาโมเดลให้ทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น

แพลตฟอร์มอินเฟอเรนซ์ ใหม่นี้คาดว่าจะเปิดตัวในงานประชุมนักพัฒนา GTC ประจำปีของ Nvidia ที่เมืองซานโฮเซ ภายในช่วงปลายเดือนนี้ และจะผสานเทคโนโลยีที่บริษัทได้มาจากสตาร์ทอัพด้านชิปอย่าง Groq ซึ่งเข้าซื้อกิจการในเดือนธันวาคม
อินเฟอเรนซ์ ซึ่งหมายถึงกระบวนการนำโมเดล AI ที่ผ่านการฝึกแล้วไปใช้งานจริงในระบบโปรดักชัน ได้กลายเป็นจุดโฟกัสสำคัญของอุตสาหกรรม AI โดยคู่แข่งของ Nvidia อย่าง Google และ Amazon Web Services ต่างก็พัฒนาชิปอินเฟอเรนซ์เฉพาะทางที่แข่งขันกับหน่วยประมวลผลกราฟิกของ Nvidia นอกจากนี้ บริษัทยังต้องเผชิญการแข่งขันจากสตาร์ทอัพชิปอินเฟอเรนซ์โดยตรง เช่น Cerebras Systems และ SambaNova Systems
Wall Street Journal ระบุว่า OpenAI ได้เข้าถึงชิปอินเฟอเรนซ์ใหม่ของ Nvidia ตั้งแต่ช่วงแรก และจะกลายเป็นหนึ่งในผู้ใช้งานรายแรก ๆ ซึ่งถือเป็นชัยชนะครั้งสำคัญของผู้ผลิตชิปรายนี้ แม้ว่า OpenAI จะมองหาทางเลือกที่มีประสิทธิภาพมากกว่าชิป GPU ของ Nvidia เพื่อกระจายโครงสร้างระบบคอมพิวติ้งของตน แต่เมื่อสัปดาห์ที่แล้ว OpenAI ก็ได้รับเงินทุนมูลค่า 30,000 ล้านดอลลาร์จากผู้ผลิตชิปรายใหญ่ที่สุดของโลก ซึ่งเป็นดีลที่ตอกย้ำความมุ่งมั่นที่มีต่อ Nvidia
Nvidia เป็นผู้ผลิต GPU ที่ทรงอิทธิพลที่สุดในโลก ซึ่งเป็นโปรเซสเซอร์เฉพาะทางที่สามารถประมวลผลงานหลายพันล้านรายการพร้อมกันได้ อย่างไรก็ตาม แม้บริษัทจะยืนยันว่า GPU ของตนเหมาะทั้งสำหรับการฝึกโมเดลและการทำอินเฟอเรนซ์ แต่ชิปเหล่านี้ก็ไม่ได้ถูกมองว่าเป็นตัวเลือกที่มีประสิทธิภาพสูงสุดสำหรับการขับเคลื่อนแอปพลิเคชัน AI อีกต่อไป หลายบริษัทพบว่าชิปของ Nvidia ใช้พลังงานสูงเกินไป ทำให้มีต้นทุนสูงมาก โดยเฉพาะสำหรับแอปพลิเคชันอย่างเอเจนต์ AI ซึ่งทำงานอัตโนมัติแทนผู้ใช้งานมนุษย์และต้องการพลังการประมวลผลจำนวนมหาศาล
นั่นจึงเป็นเหตุผลที่ OpenAI ลงนามสัญญามูลค่าหลายพันล้านดอลลาร์กับ Cerebras เมื่อเดือนที่แล้ว เพื่อเข้าถึงชิปอินเฟอเรนซ์ขนาดเท่าจานอาหารของบริษัท ซึ่ง Cerebras อ้างว่าซิลิคอนของตนทำงานด้านอินเฟอเรนซ์ได้เร็วกว่าชิป GPU ของ Nvidia อย่างมาก
มีรายงานว่าชิปอินเฟอเรนซ์ของ Nvidia จะผสานเทคโนโลยีที่พัฒนาโดย Groq โดย Nvidia จ่ายเงิน 20,000 ล้านดอลลาร์เพื่อขอสิทธิ์ใช้งานเทคโนโลยีของ Groq แบบไม่ผูกขาดในเดือนธันวาคม และเป็นส่วนหนึ่งของดีลนั้น บริษัทได้ว่าจ้างผู้ก่อตั้งและประธานเจ้าหน้าที่บริหาร Jonathan Ross รวมถึงประธานบริษัท Sunny Madra เข้ามาร่วมงาน ดีลนี้ถูกยกให้เป็นหนึ่งในการควบรวมกิจการเพื่อซื้อตัวบุคลากรที่ใหญ่ที่สุดในประวัติศาสตร์ซิลิคอนวัลเลย์
ชิปอินเฟอเรนซ์ของ Groq เป็นที่รู้จักในชื่อ “หน่วยประมวลผลภาษา” ซึ่งอาศัยสถาปัตยกรรมใหม่ทั้งหมดที่ช่วยให้สามารถทำอินเฟอเรนซ์ได้โดยใช้พลังงานต่ำกว่ามาก อย่างไรก็ตาม Nvidia ยังไม่ได้เปิดเผยว่าจะนำเทคโนโลยีของสตาร์ทอัพรายนี้ไปใช้อย่างไร
มีรายงานว่า OpenAI ต้องการใช้ชิปอินเฟอเรนซ์ใหม่ของ Nvidia เพื่อขับเคลื่อนเครื่องมือเขียนโปรแกรม Codex ซึ่งเป็นคู่แข่งของ Claude Code จาก Anthropic แอปพลิเคชันด้านการเขียนโค้ดได้กลายเป็นหนึ่งในกรณีการใช้งาน AI แบบรู้สร้างที่ทรงพลังและทำกำไรสูงที่สุด และเป็นพื้นที่ที่ OpenAI ยังเป็นรอง เนื่องจาก Claude Code ถูกมองอย่างกว้างขวางว่าเป็นผู้นำตลาด
นอกจากนี้ Nvidia ยังผลักดันหน่วยประมวลผลกลางหรือ CPU ของตนในฐานะทางเลือกอีกทางสำหรับการรันเวิร์กโหลดอินเฟอเรนซ์ โดยตามธรรมเนียมแล้ว บริษัทส่วนใหญ่มักจับคู่ GPU กับ CPU เพื่อชดเชยข้อจำกัดซึ่งกันและกัน
อย่างไรก็ตาม Nvidia ระบุว่าเวิร์กโหลด AI แบบเอเจนต์บางประเภทสามารถทำงานได้อย่างมีประสิทธิภาพมากกว่าบน Grace CPU รุ่นล้ำสมัยของบริษัทเพียงอย่างเดียว เมื่อเดือนที่แล้ว Meta Platforms กลายเป็นบริษัทแรกที่ให้คำมั่นจะใช้งานระบบ CPU-only ขนาดใหญ่เป็นครั้งแรก เพื่อรองรับเอเจนต์สำหรับการกำหนดเป้าหมายโฆษณาในระบบโปรดักชัน
ที่มา: https://siliconangle.com/2026/03/01/report-nvidia-working-top-secret-ai-inference-chip-debut-next-month/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






