Nvidia ประกาศแผนการลงทุนจำนวน 2 พันล้านดอลลาร์ใน Nebius Group ซึ่งเป็นผู้ให้บริการคลาวด์สัญชาติดัตช์ที่เชี่ยวชาญด้านเวิร์กโหลดปัญญาประดิษฐ์โดยเฉพาะ

เงินทุนดังกล่าวจะช่วยให้บริษัทขยายโครงสร้างพื้นฐานดาต้าเซ็นเตอร์ ซึ่ง Nebius มีแผนที่จะติดตั้งเซิร์ฟเวอร์ที่ประกอบด้วยหน่วยประมวลผลกราฟิก (GPU) รุ่นล่าสุดอย่าง Rubin และหน่วยประมวลผลกลาง (CPU) รุ่น Vera จาก Nvidia นอกจากนี้ บริษัทยังจะนำชิปซีรีส์ BlueField มาใช้งาน เพื่อช่วยแบ่งเบาภาระงานรอง เช่น การจัดการฮาร์ดแวร์จัดเก็บข้อมูลออกจาก CPU ของเซิร์ฟเวอร์
ปัจจุบันกราฟิกการ์ดระดับสูงที่สุดของ Nvidia ที่ Nebius ให้บริการแก่ลูกค้าคือ Blackwell ส่วน Rubin ซึ่งเป็น GPU รุ่นใหม่ที่ Nebius กำลังจะนำมาใช้นั้น สามารถรันเวิร์กโหลดอินเฟอเรนซ์ได้อย่างคุ้มค่ากว่าเดิมถึง 10 เท่า
Vera ซึ่งเป็น CPU ที่ Nebius จะติดตั้งควบคู่ไปกับ Rubin ก็มีประสิทธิภาพมากกว่ารุ่นก่อนหน้าเช่นกัน โดยมีรายงานว่าอุปกรณ์ที่ติดตั้งชิปทั้งสองรุ่นนี้ให้ประสิทธิภาพต่อวัตต์ดีกว่าฮาร์ดแวร์รุ่นก่อนของ Nvidia ถึง 10 เท่า ระบบเหล่านี้มีน้ำหนักประมาณ 2 ตัน ประกอบด้วย Rubin GPU 72 ตัว, Vera CPU 32 ตัว และชิปอื่น ๆ อีกกว่า 1,000 ตัว
บริษัทดำเนินการโฮสต์โครงสร้างพื้นฐานในดาต้าเซ็นเตอร์ที่บริหารจัดการเองและในสถานบริการฝากวางเซิร์ฟเวอร์ โดยไซต์งานที่ใหญ่ที่สุดของบริษัทคือคลาวด์แคมปัสขนาด 300 เมกะวัตต์ ซึ่งกำลังอยู่ระหว่างการก่อสร้างในนิวเจอร์ซีย์ นอกจากนี้ เครือข่ายดาต้าเซ็นเตอร์ยังครอบคลุมไปถึงสหราชอาณาจักร ฝรั่งเศส ฟินแลนด์ และไอซ์แลนด์ Nebius ให้บริการ GPU แบบโฮสต์ควบคู่ไปกับบริการจัดการที่ออกแบบมาเพื่อช่วยให้การพัฒนาโมเดล AI สะดวกขึ้น โดยมีทั้ง MLFlow เวอร์ชันที่บริหารจัดการให้ ซึ่งเป็นเครื่องมือโอเพนซอร์สสำหรับวิเคราะห์ข้อมูลเทเลเมทรีจากการเทรน AI เพื่อหาจุดที่ไม่มีประสิทธิภาพ และอีกหนึ่งบริการของ Nebius คือการนำเสนอ Jupyter Notebook ซึ่งเป็นเครื่องมือแก้ไขโค้ดที่ใช้กันอย่างแพร่หลายในโปรเจกต์ AI ผ่านระบบคลาวด์
นอกเหนือจากการลงทุนของ Nvidia แล้ว วันนี้ Nebius ยังได้นำโมเดล Nemotron 3 Super ของผู้ผลิตชิปรายนี้มาให้บริการบนคลาวด์ของตนด้วย โดยเป็นอัลกอริทึมแบบ Mixture-of-Experts ที่ปรับแต่งมาเพื่อขับเคลื่อนเอเจนต์ AI โดยเฉพาะ ทั้งนี้ Nemotron 3 Super สามารถรับคำสั่งได้สูงสุดถึง 1 ล้านโทเคน และจะดึงพารามิเตอร์มาใช้งานเพียง 1 ใน 10 จากทั้งหมด 1.2 แสนล้านพารามิเตอร์เพื่อสร้างคำตอบ
โมเดลดังกล่าวพร้อมใช้งานผ่านบริการของ Nebius ที่ชื่อว่า Token Factory ซึ่งเป็นการต่อยอดโมเดล AI แบบโอเพนซอร์สด้วยฟีเจอร์การขยายระบบอัตโนมัติและมาตรการป้องกันด้านความมั่นคงปลอดภัย นอกจากนี้ ยังมีการรองรับวิธีการเพิ่มประสิทธิภาพที่เรียกว่า Speculative Decoding ซึ่งช่วยเร่งความเร็วอินเฟอเรนซ์โดยอนุญาตให้โมเดล AI ส่งต่องานคำนวณบางส่วนไปยังโครงข่ายประสาทเทียมที่มีขนาดเล็กกว่าและใช้ฮาร์ดแวร์ได้อย่างมีประสิทธิภาพมากกว่า Nebius วางแผนที่จะติดตั้งกำลังการประมวลผลเพิ่มเติมมากกว่า 5 กิกะวัตต์ภายในสิ้นทศวรรษนี้เพื่อรองรับเวิร์กโหลดของลูกค้า ซึ่งนอกจากการจัดหาฮาร์ดแวร์สำหรับโครงการนี้แล้ว Nvidia จะสนับสนุนด้านวัสดุการออกแบบคลัสเตอร์ AI, “การตรวจสอบทางเทคนิค” และการสนับสนุนในรูปแบบอื่น ๆ อีกด้วย
การลงทุนครั้งนี้เกิดขึ้นเพียงไม่กี่สัปดาห์หลังจากที่ผู้ผลิต GPU รายนี้ได้ลงนามในข้อตกลงที่คล้ายคลึงกันกับ CoreWeave ซึ่งเป็นผู้ให้บริการคลาวด์ AI อีกราย โดย Nvidia ตกลงที่จะลงทุน 2 พันล้านดอลลาร์ในสตาร์ทอัพรายดังกล่าว หลังจากที่ก่อนหน้านี้ได้สั่งซื้อโครงสร้างพื้นฐานคลาวด์มูลค่า 6.3 พันล้านดอลลาร์ โดย CoreWeave มีแผนที่จะติดตั้งกำลังการประมวลผลมากกว่า 5 กิกะวัตต์ภายในปี 2030
ที่มา: https://siliconangle.com/2026/03/11/nvidia-invests-2b-ai-cloud-operator-nebius/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






