Nvidia ประกาศเปิดตัวหน่วยประมวลผลกราฟิกเรือธงรุ่นใหม่ Rubin ซึ่งมอบประสิทธิภาพการประมวลผลงานอินเฟอเรนซ์สูงกว่า Blackwell ถึงห้าเท่า ชิป GPU รุ่นใหม่นี้เปิดตัวที่งาน CES พร้อมกับชิปศูนย์ข้อมูลอีกห้ารุ่น ลูกค้าสามารถใช้งานชิปเหล่านี้ร่วมกันในแร็กที่ชื่อ Vera Rubin NVL72 ซึ่ง Nvidia ระบุว่ามาพร้อมทรานซิสเตอร์ 220 ล้านล้านตัว แบนด์วิดท์มากกว่าทั้งอินเทอร์เน็ต และระบบตรวจสอบสุขภาพของส่วนประกอบแบบเรียลไทม์

Rubin มีทรานซิสเตอร์ 336 พันล้านตัวที่มอบสมรรถนะ 50 เพตะฟลอปส์เมื่อประมวลผลข้อมูลแบบ NVFP4 ส่วน Blackwell ซึ่งเป็นสถาปัตยกรรม GPU รุ่นก่อนหน้าของ Nvidia ให้สมรรถนะได้สูงสุด 10 เพตะฟลอปส์ ขณะที่ความเร็วการฝึกโมเดลของ Rubin เร็วกว่าถึง 250% ที่ 35 เพตะฟลอปส์
บางส่วนของพลังประมวลผลนี้มาจากโมดูลที่เรียกว่า Transformer Engine ซึ่งมีให้ใช้งานใน Blackwell เช่นกัน ตามข้อมูลของ Nvidia Transformer Engine ของ Rubin ออกแบบใหม่และมาพร้อมความสามารถเพิ่มประสิทธิภาพที่เรียกว่า hardware-accelerated adaptive compression การบีบอัดไฟล์ช่วยลดจำนวนบิตที่มีอยู่ ซึ่งทำให้จำนวนข้อมูลที่โมเดล AI ต้องประมวลผลลดลง และช่วยเร่งความเร็วการประมวลผล
“Rubin มาถึงในช่วงเวลาที่เหมาะสมพอดี ในขณะที่ความต้องการประมวลผล AI ทั้งด้านเทรนนิงและอินเฟอเรนซ์กำลังพุ่งสูงอย่างมาก” Jensen Huang ประธานเจ้าหน้าที่บริหารของ Nvidia กล่าว “ด้วยจังหวะการส่งมอบซูเปอร์คอมพิวเตอร์ AI รุ่นใหม่ทุกปี และการออกแบบร่วมกันอย่างสุดขั้วในหกชิปรุ่นใหม่ Rubin ก้าวกระโดดครั้งใหญ่สู่พรมแดนถัดไปของ AI”
Nvidia มีแผนจัดส่งซิลิคอนรุ่นใหม่ของบริษัทในรูปแบบอุปกรณ์สำเร็จรูปที่เรียกว่า Vera Rubin NVL72 ซึ่งจะรวมชิป Rubin จำนวน 72 ตัว เข้ากับ Vera ซีพียูรุ่นใหม่ของบริษัทจำนวน 36 ตัวที่เปิดตัวในงาน CES เช่นกัน Vera มาพร้อมแกนประมวลผล 88 คอร์ จากการออกแบบแบบกำหนดเองชื่อ Olympus และรองรับ Armv9.2 ซึ่งเป็นสถาปัตยกรรมชุดคำสั่งของ Arm ที่ใช้งานกันอย่างแพร่หลาย
Vera Rubin NVL72 เก็บชิปไว้ในโมดูลที่เรียกว่าถาด (tray) โดย Nvidia ระบุว่าถาดมีการออกแบบแบบไร้สายเคเบิล ซึ่งช่วยลดเวลาในการติดตั้งและบำรุงรักษาลงได้มากถึง 18 เท่าเมื่อเทียบกับอุปกรณ์ที่ใช้ Blackwell นอกจากนี้ RAS Engine ซึ่งเป็นระบบย่อยในแร็ก GPU ของบริษัทที่ช่วยทำงานบำรุงรักษาบางอย่างแบบอัตโนมัติ ก็ได้รับการอัปเกรดเช่นกัน โดยมอบความสามารถด้านความทนทานต่อความผิดพลาดและตรวจสอบสุขภาพฮาร์ดแวร์แบบเรียลไทม์เพื่อยืนยันว่าฮาร์ดแวร์ทำงานตามปกติ
Nvidia ระบุว่า Vera Rubin NVL72 มอบแบนด์วิดท์ 260 เทราบิตต่อวินาที ซึ่งมากกว่าทั้งอินเทอร์เน็ต อุปกรณ์นี้ประมวลผลทราฟฟิกของโมเดล AI ด้วยความช่วยเหลือของชิปสามตัว ได้แก่ NVLink 6 Switch, Spectrum-6 และ ConnectX-9 ซึ่งทั้งหมดเปิดตัวในงาน CES ครั้งนี้
NVLink 6 Switch ช่วยให้ GPU หลายตัวในแร็ก Vera Rubin NVL72 สามารถแลกเปลี่ยนข้อมูลกันได้พร้อมกัน ซึ่งจำเป็นสำหรับการประสานงานการทำงานของ GPU ระหว่างการรันโมเดล AI แบบกระจาย ส่วน Spectrum-6 เป็นสวิตช์ Ethernet ที่ช่วยการเชื่อมต่อระหว่าง GPU ในแร็กต่าง ๆ
ชิปเครือข่ายตัวที่สามของ Nvidia คือ ConnectX-9 ซึ่งเป็น SuperNIC อินเทอร์เฟซฮาร์ดแวร์ที่ช่วยให้เซิร์ฟเวอร์เข้าถึงเครือข่ายของศูนย์ข้อมูลโฮสต์ ConnectX-9 จัดการงานด้านเครือข่ายที่เดิมซีพียูของเซิร์ฟเวอร์ต้องทำเอง ทำให้เหลือกำลังประมวลผลมากขึ้นสำหรับงาน AI
นอกจากนี้ Nvidia ยังเปิดตัว BlueField-4 ซึ่งเป็น DPU หรือหน่วยประมวลผลข้อมูล ทั้งนี้ DPU จะช่วยแบ่งเบาภาระงานจากโปรเซสเซอร์หลักของเซิร์ฟเวอร์คล้าย SuperNIC แต่รองรับงานหลากหลายกว่านั้น BlueField-4 สามารถประมวลผลงานด้านเครือข่าย รวมถึงงานด้านความมั่นคงปลอดภัยไซเบอร์และการจัดการระบบจัดเก็บข้อมูลบางประเภท
BlueField-4 เป็นพลังขับเคลื่อนระบบจัดเก็บข้อมูลใหม่ที่ Nvidia เรียกว่า Inference Context Memory Storage Platform โดยบริษัทระบุว่าจะช่วยเพิ่มประสิทธิภาพแคช key-value ของโมเดลภาษาขนาดใหญ่
กลไก attention ของ LLM ซึ่งเป็นองค์ประกอบที่ใช้ตัดสินว่าจะใช้ข้อมูลใดและอย่างไร มักทำการคำนวณซ้ำ ๆ แคช key-value ช่วยให้ LLM คำนวณงานที่เกิดขึ้นซ้ำบ่อย ๆ เพียงครั้งเดียว บันทึกผลลัพธ์ และนำกลับมาใช้ใหม่ วิธีนี้ใช้ฮาร์ดแวร์ได้คุ้มค่ากว่าการคำนวณใหม่ทุกครั้ง
Vera Rubin NVL72 จะจัดส่งควบคู่ไปกับอุปกรณ์รุ่นเล็กกว่า DGX Rubin NVL8 ซึ่งมี GPU Rubin แปดตัวแทนที่จะเป็น 72 ทั้งสองระบบเป็นพื้นฐานของ DGX SuperPOD ซึ่งเป็นสถาปัตยกรรมอ้างอิงใหม่สำหรับสร้างคลัสเตอร์ AI โดยผสานชิปรุ่นล่าสุดของ Nvidia เข้ากับแพลตฟอร์มซอฟต์แวร์ที่ชื่อ Mission Control ที่บริษัทต่าง ๆ สามารถใช้ในการจัดการโครงสร้างพื้นฐาน AI ของตน
ระบบที่ใช้ Rubin จะเริ่มจัดส่งในช่วงครึ่งหลังของปี 2026
ที่มา: https://siliconangle.com/2026/01/05/nvidia-debuts-rubin-chip-336b-transistors-50-petaflops-ai-performance/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






