Nvidia กำลังพัฒนาชิป AI ลับสุดยอดสำหรับงานอินเฟอเรนซ์ อาจเปิดตัวเดือนหน้า

March 2, 2026 AI, Cloud and Systems, CPU, GPU, IT Business, NVidia, Products, Server and Storage

มีรายงานจาก Wall Street Journal ว่า Nvidia กำลังพัฒนาโปรเซสเซอร์เฉพาะสำหรับงานอินเฟอเรนซ์ ซึ่งจะถูกนำไปใช้โดย OpenAI Group และบริษัทปัญญาประดิษฐ์อื่น ๆ เพื่อพัฒนาโมเดลให้ทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น

แพลตฟอร์มอินเฟอเรนซ์ ใหม่นี้คาดว่าจะเปิดตัวในงานประชุมนักพัฒนา GTC ประจำปีของ Nvidia ที่เมืองซานโฮเซ ภายในช่วงปลายเดือนนี้ และจะผสานเทคโนโลยีที่บริษัทได้มาจากสตาร์ทอัพด้านชิปอย่าง Groq ซึ่งเข้าซื้อกิจการในเดือนธันวาคม

อินเฟอเรนซ์ ซึ่งหมายถึงกระบวนการนำโมเดล AI ที่ผ่านการฝึกแล้วไปใช้งานจริงในระบบโปรดักชัน ได้กลายเป็นจุดโฟกัสสำคัญของอุตสาหกรรม AI โดยคู่แข่งของ Nvidia อย่าง Google และ Amazon Web Services ต่างก็พัฒนาชิปอินเฟอเรนซ์เฉพาะทางที่แข่งขันกับหน่วยประมวลผลกราฟิกของ Nvidia นอกจากนี้ บริษัทยังต้องเผชิญการแข่งขันจากสตาร์ทอัพชิปอินเฟอเรนซ์โดยตรง เช่น Cerebras Systems และ SambaNova Systems

Wall Street Journal ระบุว่า OpenAI ได้เข้าถึงชิปอินเฟอเรนซ์ใหม่ของ Nvidia ตั้งแต่ช่วงแรก และจะกลายเป็นหนึ่งในผู้ใช้งานรายแรก ๆ ซึ่งถือเป็นชัยชนะครั้งสำคัญของผู้ผลิตชิปรายนี้ แม้ว่า OpenAI จะมองหาทางเลือกที่มีประสิทธิภาพมากกว่าชิป GPU ของ Nvidia เพื่อกระจายโครงสร้างระบบคอมพิวติ้งของตน แต่เมื่อสัปดาห์ที่แล้ว OpenAI ก็ได้รับเงินทุนมูลค่า 30,000 ล้านดอลลาร์จากผู้ผลิตชิปรายใหญ่ที่สุดของโลก ซึ่งเป็นดีลที่ตอกย้ำความมุ่งมั่นที่มีต่อ Nvidia

Nvidia เป็นผู้ผลิต GPU ที่ทรงอิทธิพลที่สุดในโลก ซึ่งเป็นโปรเซสเซอร์เฉพาะทางที่สามารถประมวลผลงานหลายพันล้านรายการพร้อมกันได้ อย่างไรก็ตาม แม้บริษัทจะยืนยันว่า GPU ของตนเหมาะทั้งสำหรับการฝึกโมเดลและการทำอินเฟอเรนซ์ แต่ชิปเหล่านี้ก็ไม่ได้ถูกมองว่าเป็นตัวเลือกที่มีประสิทธิภาพสูงสุดสำหรับการขับเคลื่อนแอปพลิเคชัน AI อีกต่อไป หลายบริษัทพบว่าชิปของ Nvidia ใช้พลังงานสูงเกินไป ทำให้มีต้นทุนสูงมาก โดยเฉพาะสำหรับแอปพลิเคชันอย่างเอเจนต์ AI ซึ่งทำงานอัตโนมัติแทนผู้ใช้งานมนุษย์และต้องการพลังการประมวลผลจำนวนมหาศาล

นั่นจึงเป็นเหตุผลที่ OpenAI ลงนามสัญญามูลค่าหลายพันล้านดอลลาร์กับ Cerebras เมื่อเดือนที่แล้ว เพื่อเข้าถึงชิปอินเฟอเรนซ์ขนาดเท่าจานอาหารของบริษัท ซึ่ง Cerebras อ้างว่าซิลิคอนของตนทำงานด้านอินเฟอเรนซ์ได้เร็วกว่าชิป GPU ของ Nvidia อย่างมาก

มีรายงานว่าชิปอินเฟอเรนซ์ของ Nvidia จะผสานเทคโนโลยีที่พัฒนาโดย Groq โดย Nvidia จ่ายเงิน 20,000 ล้านดอลลาร์เพื่อขอสิทธิ์ใช้งานเทคโนโลยีของ Groq แบบไม่ผูกขาดในเดือนธันวาคม และเป็นส่วนหนึ่งของดีลนั้น บริษัทได้ว่าจ้างผู้ก่อตั้งและประธานเจ้าหน้าที่บริหาร Jonathan Ross รวมถึงประธานบริษัท Sunny Madra เข้ามาร่วมงาน ดีลนี้ถูกยกให้เป็นหนึ่งในการควบรวมกิจการเพื่อซื้อตัวบุคลากรที่ใหญ่ที่สุดในประวัติศาสตร์ซิลิคอนวัลเลย์

ชิปอินเฟอเรนซ์ของ Groq เป็นที่รู้จักในชื่อ “หน่วยประมวลผลภาษา” ซึ่งอาศัยสถาปัตยกรรมใหม่ทั้งหมดที่ช่วยให้สามารถทำอินเฟอเรนซ์ได้โดยใช้พลังงานต่ำกว่ามาก อย่างไรก็ตาม Nvidia ยังไม่ได้เปิดเผยว่าจะนำเทคโนโลยีของสตาร์ทอัพรายนี้ไปใช้อย่างไร

มีรายงานว่า OpenAI ต้องการใช้ชิปอินเฟอเรนซ์ใหม่ของ Nvidia เพื่อขับเคลื่อนเครื่องมือเขียนโปรแกรม Codex ซึ่งเป็นคู่แข่งของ Claude Code จาก Anthropic แอปพลิเคชันด้านการเขียนโค้ดได้กลายเป็นหนึ่งในกรณีการใช้งาน AI แบบรู้สร้างที่ทรงพลังและทำกำไรสูงที่สุด และเป็นพื้นที่ที่ OpenAI ยังเป็นรอง เนื่องจาก Claude Code ถูกมองอย่างกว้างขวางว่าเป็นผู้นำตลาด

นอกจากนี้ Nvidia ยังผลักดันหน่วยประมวลผลกลางหรือ CPU ของตนในฐานะทางเลือกอีกทางสำหรับการรันเวิร์กโหลดอินเฟอเรนซ์ โดยตามธรรมเนียมแล้ว บริษัทส่วนใหญ่มักจับคู่ GPU กับ CPU เพื่อชดเชยข้อจำกัดซึ่งกันและกัน

อย่างไรก็ตาม Nvidia ระบุว่าเวิร์กโหลด AI แบบเอเจนต์บางประเภทสามารถทำงานได้อย่างมีประสิทธิภาพมากกว่าบน Grace CPU รุ่นล้ำสมัยของบริษัทเพียงอย่างเดียว เมื่อเดือนที่แล้ว Meta Platforms กลายเป็นบริษัทแรกที่ให้คำมั่นจะใช้งานระบบ CPU-only ขนาดใหญ่เป็นครั้งแรก เพื่อรองรับเอเจนต์สำหรับการกำหนดเป้าหมายโฆษณาในระบบโปรดักชัน

ที่มา: https://siliconangle.com/2026/03/01/report-nvidia-working-top-secret-ai-inference-chip-debut-next-month/

NCSA ร่วมกับ Veeam ขอเชิญทุกท่านเข้าร่วมงานสัมมนาออนไลน์ในหัวข้อ “Data Trust ในยุค AI” [4 ส.ค. 2569 — 14.00น.]

NCSA ร่วมกับ Veeam ขอเชิญทุกท่านเข้าร่วมงานสัมมนาออนไลน์ในหัวข้อ “Data Trust ในยุค AI” เพื่อเรียนรู้กับการป้องกันไม่ให้ข้อมูลสำคัญขององค์กรหรือหน่วยงาน รั่วไหลไปกับการใช้งาน AI Agent ที่มีความรวดเร็วและซับซ้อนขึ้นเรื่อยๆ ด้วยมาตรการต่างๆ เช่น …

รายงาน 2026H1 Threat Review จาก Forescout ชี้ช่องโหว่พุ่ง 51% และ Ransomware เพิ่มขึ้น 25%

Forescout เผยรายงาน 2026H1 Threat Review วิเคราะห์แนวโน้มภัยคุกคามไซเบอร์ทั่วโลกในครึ่งแรกของปี 2026 พบช่องโหว่ที่ถูกเผยแพร่เพิ่มขึ้น 51% เมื่อเทียบกับปีก่อน ขณะที่การอ้างการโจมตีด้วย Ransomware เพิ่มขึ้น 25%

TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

Nvidia กำลังพัฒนาชิป AI ลับสุดยอดสำหรับงานอินเฟอเรนซ์ อาจเปิดตัวเดือนหน้า

About นักเขียนฝึกหัดหมายเลขเก้า

Related Articles

Check Also

NCSA ร่วมกับ Veeam ขอเชิญทุกท่านเข้าร่วมงานสัมมนาออนไลน์ในหัวข้อ “Data Trust ในยุค AI” [4 ส.ค. 2569 — 14.00น.]

รายงาน 2026H1 Threat Review จาก Forescout ชี้ช่องโหว่พุ่ง 51% และ Ransomware เพิ่มขึ้น 25%

Nvidia กำลังพัฒนาชิป AI ลับสุดยอดสำหรับงานอินเฟอเรนซ์ อาจเปิดตัวเดือนหน้า

Share this:

About นักเขียนฝึกหัดหมายเลขเก้า

Related Articles

Check Also