ในวงการ AI ประสิทธิภาพการประมวลผลไม่ได้วัดกันที่ความเร็วของ GPU เพียงอย่างเดียวอีกต่อไป แต่คือการทำงานร่วมกันของทั้งระบบ ล่าสุดในงาน CES 2026 NVIDIA ได้ประกาศเปิดตัวแพลตฟอร์ม Rubin ที่ถูกวางตำแหน่งให้เป็น AI Supercomputer ยุคถัดไปที่เข้ามาสานต่อความสำเร็จจากสถาปัตยกรรม Blackwell โดยมุ่งเน้นไปที่การรองรับ Agentic AI และการประมวลผลโมเดลขนาดใหญ่ที่มีความซับซ้อนสูง

Rubin ไม่ใช่แค่ GPU รุ่นใหม่ แต่คือการทำ Extreme Codesign ระหว่างฮาร์ดแวร์และซอฟต์แวร์ผ่านชิปใหม่ถึง 6 ตัว เพื่อลดระยะเวลาในการเทรนโมเดลและลดต้นทุนในการทำ Inference อย่างมหาศาล
Extreme Codesign เมื่อ 6 ชิปทำงานเป็นหนึ่งเดียว
หัวใจหลักของ Rubin คือการบูรณาการชิป 6 ประเภทเข้าด้วยกันเพื่อขจัดคอขวดในการส่งข้อมูลและเพิ่มประสิทธิภาพต่อวัตต์ให้สูงสุดประกอบด้วย
- NVIDIA Rubin GPU: มาพร้อม Transformer Engine เจนเนอเรชันที่ 3 รองรับการประมวลผล NVFP4 สูงถึง 50 Petaflops
- NVIDIA Vera CPU: ชิปประมวลผลที่ออกแบบมาเพื่อ Agentic Reasoning โดยเฉพาะ ใช้คอร์ Olympus แบบ Custom บนสถาปัตยกรรม Armv9.2
- NVIDIA NVLink 6 Switch: ระบบเชื่อมต่อความเร็วสูงที่รองรับ Bandwidth ถึง 3.6TB/s ต่อ GPU
- NVIDIA BlueField-4 DPU: หน่วยประมวลผลข้อมูลที่มาพร้อมระบบ Trust Architecture (ASTRA) เพื่อความปลอดภัยในระดับโครงสร้างพื้นฐาน
- NVIDIA ConnectX-9 SuperNIC และ Spectrum-6 Ethernet Switch: ระบบเครือข่ายความเร็วสูงที่ออกแบบมาเพื่อสเกล AI Factory ระดับล้าน GPU
ประสิทธิภาพที่เหนือกว่า Blackwell
เมื่อเทียบกับแพลตฟอร์ม Blackwell ตัว NVIDIA Rubin สามารถสร้างมาตรฐานใหม่ในแง่ของความคุ้มค่าและประสิทธิภาพดังนี้
- ลดต้นทุน Inference Token ลง 10 เท่า: ด้วยเทคโนโลยี Adaptive Compression และการออกแบบระบบใหม่ ทำให้การตอบสนองของ AI มีต้นทุนที่ต่ำลงอย่างมาก
- เทรนโมเดล MoE เร็วขึ้น: Rubin ใช้จำนวน GPU น้อยลงถึง 4 เท่าในการเทรนโมเดล MoE ขนาดใหญ่ เมื่อเทียบกับ Blackwell
- Bandwidth มหาศาล: ในระดับ Rack (Vera Rubin NVL72) ระบบสามารถส่งข้อมูลได้รวมถึง 260TB/s ซึ่งมากกว่า Bandwidth ของอินเทอร์เน็ตทั้งโลกรวมกัน
นวัตกรรมเพื่อ Agentic AI
Rubin มาพร้อมกับ NVIDIA Inference Context Memory Storage Platform ซึ่งเป็นโครงสร้างพื้นฐานการจัดเก็บข้อมูลแบบ AI-native ช่วยให้การแชร์และดึง Key-Value Cache Data กลับมาใช้ใหม่ทำได้อย่างมีประสิทธิภาพ สิ่งนี้จำเป็นอย่างยิ่งสำหรับ Agentic AI ที่ต้องมีการคิดวิเคราะห์แบบหลายขั้นตอน และต้องการบริบทที่ยาวขึ้น
นอกจากนี้ NVIDIA ยังให้ความสำคัญกับความมั่นคงปลอดภัยด้วย Confidential Computing รุ่นที่ 3 ซึ่งปกป้องข้อมูลทั้งในส่วนของ CPU, GPU และ NVLink ทำให้องค์กรสามารถเทรนและรันโมเดลที่เป็นความลับทางการค้าได้อย่างมั่นใจบนระบบ Bare-metal หรือ Multi-tenant
NVIDIA ยืนยันว่าแพลตฟอร์ม Rubin กำลังอยู่ในขั้นตอนการผลิตเต็มรูปแบบ โดยผลิตภัณฑ์ที่ใช้ฐานสถาปัตยกรรมนี้จะเริ่มวางจำหน่ายผ่านพาร์ทเนอร์อย่าง AWS, Google Cloud, Microsoft Azure และผู้ผลิตเซิร์ฟเวอร์ชั้นนำอย่าง Dell, HPE และ Lenovo ในช่วงครึ่งหลังของปี 2026 เป็นต้นไป
ที่มา: https://nvidianews.nvidia.com/news/rubin-platform-ai-supercomputer
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






