Nvidia กำลังพัฒนาชิป AI ลับสุดยอดสำหรับงานอินเฟอเรนซ์ อาจเปิดตัวเดือนหน้า

มีรายงานจาก Wall Street Journal ว่า Nvidia กำลังพัฒนาโปรเซสเซอร์เฉพาะสำหรับงานอินเฟอเรนซ์ ซึ่งจะถูกนำไปใช้โดย OpenAI Group และบริษัทปัญญาประดิษฐ์อื่น ๆ เพื่อพัฒนาโมเดลให้ทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น

Credit: NVIDIA

แพลตฟอร์มอินเฟอเรนซ์ ใหม่นี้คาดว่าจะเปิดตัวในงานประชุมนักพัฒนา GTC ประจำปีของ Nvidia ที่เมืองซานโฮเซ ภายในช่วงปลายเดือนนี้ และจะผสานเทคโนโลยีที่บริษัทได้มาจากสตาร์ทอัพด้านชิปอย่าง Groq ซึ่งเข้าซื้อกิจการในเดือนธันวาคม

อินเฟอเรนซ์ ซึ่งหมายถึงกระบวนการนำโมเดล AI ที่ผ่านการฝึกแล้วไปใช้งานจริงในระบบโปรดักชัน ได้กลายเป็นจุดโฟกัสสำคัญของอุตสาหกรรม AI โดยคู่แข่งของ Nvidia อย่าง Google และ Amazon Web Services ต่างก็พัฒนาชิปอินเฟอเรนซ์เฉพาะทางที่แข่งขันกับหน่วยประมวลผลกราฟิกของ Nvidia นอกจากนี้ บริษัทยังต้องเผชิญการแข่งขันจากสตาร์ทอัพชิปอินเฟอเรนซ์โดยตรง เช่น Cerebras Systems และ SambaNova Systems

Wall Street Journal ระบุว่า OpenAI ได้เข้าถึงชิปอินเฟอเรนซ์ใหม่ของ Nvidia ตั้งแต่ช่วงแรก และจะกลายเป็นหนึ่งในผู้ใช้งานรายแรก ๆ ซึ่งถือเป็นชัยชนะครั้งสำคัญของผู้ผลิตชิปรายนี้ แม้ว่า OpenAI จะมองหาทางเลือกที่มีประสิทธิภาพมากกว่าชิป GPU ของ Nvidia เพื่อกระจายโครงสร้างระบบคอมพิวติ้งของตน แต่เมื่อสัปดาห์ที่แล้ว OpenAI ก็ได้รับเงินทุนมูลค่า 30,000 ล้านดอลลาร์จากผู้ผลิตชิปรายใหญ่ที่สุดของโลก ซึ่งเป็นดีลที่ตอกย้ำความมุ่งมั่นที่มีต่อ Nvidia

Nvidia เป็นผู้ผลิต GPU ที่ทรงอิทธิพลที่สุดในโลก ซึ่งเป็นโปรเซสเซอร์เฉพาะทางที่สามารถประมวลผลงานหลายพันล้านรายการพร้อมกันได้ อย่างไรก็ตาม แม้บริษัทจะยืนยันว่า GPU ของตนเหมาะทั้งสำหรับการฝึกโมเดลและการทำอินเฟอเรนซ์ แต่ชิปเหล่านี้ก็ไม่ได้ถูกมองว่าเป็นตัวเลือกที่มีประสิทธิภาพสูงสุดสำหรับการขับเคลื่อนแอปพลิเคชัน AI อีกต่อไป หลายบริษัทพบว่าชิปของ Nvidia ใช้พลังงานสูงเกินไป ทำให้มีต้นทุนสูงมาก โดยเฉพาะสำหรับแอปพลิเคชันอย่างเอเจนต์ AI ซึ่งทำงานอัตโนมัติแทนผู้ใช้งานมนุษย์และต้องการพลังการประมวลผลจำนวนมหาศาล

นั่นจึงเป็นเหตุผลที่ OpenAI ลงนามสัญญามูลค่าหลายพันล้านดอลลาร์กับ Cerebras เมื่อเดือนที่แล้ว เพื่อเข้าถึงชิปอินเฟอเรนซ์ขนาดเท่าจานอาหารของบริษัท ซึ่ง Cerebras อ้างว่าซิลิคอนของตนทำงานด้านอินเฟอเรนซ์ได้เร็วกว่าชิป GPU ของ Nvidia อย่างมาก

มีรายงานว่าชิปอินเฟอเรนซ์ของ Nvidia จะผสานเทคโนโลยีที่พัฒนาโดย Groq โดย Nvidia จ่ายเงิน 20,000 ล้านดอลลาร์เพื่อขอสิทธิ์ใช้งานเทคโนโลยีของ Groq แบบไม่ผูกขาดในเดือนธันวาคม และเป็นส่วนหนึ่งของดีลนั้น บริษัทได้ว่าจ้างผู้ก่อตั้งและประธานเจ้าหน้าที่บริหาร Jonathan Ross รวมถึงประธานบริษัท Sunny Madra เข้ามาร่วมงาน ดีลนี้ถูกยกให้เป็นหนึ่งในการควบรวมกิจการเพื่อซื้อตัวบุคลากรที่ใหญ่ที่สุดในประวัติศาสตร์ซิลิคอนวัลเลย์

ชิปอินเฟอเรนซ์ของ Groq เป็นที่รู้จักในชื่อ “หน่วยประมวลผลภาษา” ซึ่งอาศัยสถาปัตยกรรมใหม่ทั้งหมดที่ช่วยให้สามารถทำอินเฟอเรนซ์ได้โดยใช้พลังงานต่ำกว่ามาก อย่างไรก็ตาม Nvidia ยังไม่ได้เปิดเผยว่าจะนำเทคโนโลยีของสตาร์ทอัพรายนี้ไปใช้อย่างไร

มีรายงานว่า OpenAI ต้องการใช้ชิปอินเฟอเรนซ์ใหม่ของ Nvidia เพื่อขับเคลื่อนเครื่องมือเขียนโปรแกรม Codex ซึ่งเป็นคู่แข่งของ Claude Code จาก Anthropic แอปพลิเคชันด้านการเขียนโค้ดได้กลายเป็นหนึ่งในกรณีการใช้งาน AI แบบรู้สร้างที่ทรงพลังและทำกำไรสูงที่สุด และเป็นพื้นที่ที่ OpenAI ยังเป็นรอง เนื่องจาก Claude Code ถูกมองอย่างกว้างขวางว่าเป็นผู้นำตลาด

นอกจากนี้ Nvidia ยังผลักดันหน่วยประมวลผลกลางหรือ CPU ของตนในฐานะทางเลือกอีกทางสำหรับการรันเวิร์กโหลดอินเฟอเรนซ์ โดยตามธรรมเนียมแล้ว บริษัทส่วนใหญ่มักจับคู่ GPU กับ CPU เพื่อชดเชยข้อจำกัดซึ่งกันและกัน

อย่างไรก็ตาม Nvidia ระบุว่าเวิร์กโหลด AI แบบเอเจนต์บางประเภทสามารถทำงานได้อย่างมีประสิทธิภาพมากกว่าบน Grace CPU รุ่นล้ำสมัยของบริษัทเพียงอย่างเดียว เมื่อเดือนที่แล้ว Meta Platforms กลายเป็นบริษัทแรกที่ให้คำมั่นจะใช้งานระบบ CPU-only ขนาดใหญ่เป็นครั้งแรก เพื่อรองรับเอเจนต์สำหรับการกำหนดเป้าหมายโฆษณาในระบบโปรดักชัน

ที่มา: https://siliconangle.com/2026/03/01/report-nvidia-working-top-secret-ai-inference-chip-debut-next-month/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

ใช้ Agentic AI ในภาคธุรกิจองค์กรอย่างคุ้มค่าและมั่นใจ ทำ Governance ได้ครบวงจร ด้วย HPE Private Cloud AI จาก Yip In Tsoi

หนึ่งในบทสนทนาที่เกิดขึ้นในปี 2026 สำหรับภาคธุรกิจองค์กรนี้ ก็คงหนีไม่พ้นประเด็นเรื่องของการวาง AI Infrastructure สำหรับ AI Factory ภายในองค์กร เพื่อให้ธุรกิจองค์กรมี AI Sovereignty และสามารถทำ AI …

เปิดตัว GitLab 19.0 ยกระดับ Agentic Workflow และ Secrets Management

GitLab ได้ประกาศเปิดตัวเวอร์ชัน 19.0 อย่างเป็นทางการเมื่อวันที่ 21 พฤษภาคม 2026 โดยเน้นการยกระดับแพลตฟอร์มด้วย AI Workflows (Agentic Core), การจัดการความลับ (Secrets Management) …