Nvidia เข้าซื้อกิจการ SchedMD ผู้พัฒนา Slurm ยกระดับขีดความสามารถด้านซอฟต์แวร์

Nvidia ได้เข้าซื้อกิจการ SchedMD บริษัทขนาดเล็กที่ไม่ค่อยเป็นที่รู้จัก ซึ่งดูแลหนึ่งในเครื่องมือโอเพนซอร์สที่สำคัญที่สุดในระบบนิเวศของแมชชีนเลิร์นนิง

Credit: Nvidia

ผู้ผลิตชิปรายนี้ประกาศดีลดังกล่าวโดยไม่ได้เปิดเผยมูลค่าทางการเงิน

SchedMD ก่อตั้งขึ้นในปี 2010 โดยผู้พัฒนา Slurm ซึ่งเป็นแพลตฟอร์มโอเพนซอร์สสำหรับการจัดการคลัสเตอร์เซิร์ฟเวอร์ บริษัทให้บริการระดับมืออาชีพเพื่อช่วยให้องค์กรนำซอฟต์แวร์ไปใช้งานจริงบนโปรดักชัน Nvidia เปิดเผยในวันนี้ว่า SchedMD มีลูกค้าหลายร้อยราย รวมถึงหน่วยงานภาครัฐ ธนาคาร และองค์กรด้านสาธารณสุข

การฝึกโมเดลภาษาขนาดใหญ่บนการ์ดกราฟิกเพียงใบเดียวอาจใช้เวลานานเกินไป ด้วยเหตุนี้ บริษัทต่าง ๆ จึงกระจายภาระงานการฝึกไปยัง GPU จำนวนมาก ซึ่งทำให้สามารถคำนวณแบบขนานได้แทนที่จะทำทีละขั้นตอน วิธีนี้ช่วยประหยัดเวลา แต่ก็สร้างความซับซ้อนในระดับสูง

เมื่อภาระงานการฝึกทำงานบน GPU หลายตัว นักพัฒนาจำเป็นต้องตัดสินใจว่าชิปใดควรรับผิดชอบงานย่อยใด การมอบหมายงานย่อยให้กับชิปที่กำลังยุ่งอยู่แล้วอาจทำให้เกิดความล่าช้าในการฝึกโดยไม่จำเป็น นอกจากนี้ยังมีความท้าทายอื่น ๆ เช่น ความจำเป็นในการหลีกเลี่ยงสถานการณ์ที่ GPU บางส่วนถูกใช้งานไม่เต็มประสิทธิภาพ

Slurm ทำให้งานในการกำหนดว่า GPU ตัวใดควรทำงานใดและเมื่อใดเป็นไปโดยอัตโนมัติ Kubernetes ซึ่งเป็นแพลตฟอร์มโอเพนซอร์สยอดนิยมอีกตัวหนึ่งสำหรับการจัดการคลัสเตอร์ ก็มีความสามารถคล้ายกัน แต่ Slurm มีฟีเจอร์เฉพาะทางหลายอย่างที่ทำให้เหมาะสมกว่าสำหรับการรองรับภาระงานการฝึกปัญญาประดิษฐ์

หนึ่งในจุดเด่นของ Slurm คือความสามารถในการขยายตัวสูง แพลตฟอร์มนี้สามารถจัดการคลัสเตอร์ที่มี GPU มากกว่า 100,000 ตัวได้ อีกทั้งยังมีตัวเลือกการปรับแต่งในระดับละเอียด หากภาระงานสองชุดมีการแลกเปลี่ยนข้อมูลระหว่างกันเป็นประจำ นักพัฒนาสามารถให้ Slurm จัดวางไว้บนเซิร์ฟเวอร์ที่อยู่ติดกันเพื่อลดระยะทางที่ข้อมูลต้องเดินทาง Kubernetes รองรับการปรับแต่งลักษณะนี้เช่นกัน แต่ต้องอาศัยการขยายความสามารถด้วยปลั๊กอิน

SchedMD ช่วยให้องค์กรตั้งค่า Slurm และปรับแต่งให้ตรงตามความต้องการ เมื่อระบบเริ่มใช้งานจริงแล้ว บริษัทจะให้บริการสนับสนุนอย่างต่อเนื่อง เพื่อช่วยลูกค้าในงานต่าง ๆ เช่น การติดตั้งอัปเดต

บริษัทไม่ได้ดูแลเฉพาะ Slurm เท่านั้น แต่ยังดูแลโครงการโอเพนซอร์สอีกตัวหนึ่งชื่อ Slinky ซึ่งช่วยให้องค์กรสามารถรัน Slurm บน Kubernetes ได้ นั่นทำให้ไม่จำเป็นต้องรันแพลตฟอร์มโอเพนซอร์สทั้งสองบนคลัสเตอร์แยกจากกัน ส่งผลให้การจัดการในชีวิตประจำวันง่ายขึ้น นอกจากนี้ การรวมเซิร์ฟเวอร์ไว้ในคลัสเตอร์เดียวกันยังช่วยเพิ่มการใช้ประโยชน์จากฮาร์ดแวร์และลดต้นทุนได้

Nvidia ระบุว่า Slurm จะยังคงเป็นโครงการโอเพนซอร์สต่อไปหลังการเข้าซื้อกิจการ ผู้ผลิตชิปจะพัฒนาโครงการนี้ต่อ และให้บริการระดับมืออาชีพแก่ลูกค้าของ SchedMD

บริษัทยังประกาศแผนที่จะ “เร่งการเข้าถึงระบบใหม่ๆ ให้กับ SchedMD — เพื่อให้ผู้ใช้แพลตฟอร์มการประมวลผลแบบเร่งความเร็วของ Nvidia สามารถปรับแต่งภาระงานได้ทั่วทั้งโครงสร้างพื้นฐานการประมวลผลของตน” ซึ่งบ่งชี้ว่า Nvidia อาจมีแผนในการปรับแต่ง Slurm ให้เหมาะสมกับการ์ดกราฟิกซีรีส์ Rubin ที่กำลังจะมาถึง และหน่วยประมวลผลกลาง Vera

Slurm ไม่ได้ถูกใช้งานเฉพาะในคลัสเตอร์ฝึก AI เท่านั้น แต่ยังใช้ในซูเปอร์คอมพิวเตอร์ด้วย ซอฟต์แวร์นี้ขับเคลื่อนซูเปอร์คอมพิวเตอร์ที่เร็วที่สุด 100 อันดับแรกของโลกมากกว่าครึ่ง ซึ่งหลายระบบก็ใช้ซิลิคอนของ Nvidia ด้วย ความสามารถของบุคลากรที่ Nvidia ได้รับจากการเข้าซื้อ SchedMD อาจช่วยเพิ่มคุณค่าที่เสนอให้กับผู้สร้างซูเปอร์คอมพิวเตอร์ได้มากยิ่งขึ้น

ที่มา: https://siliconangle.com/2025/12/15/nvidia-acquires-slurm-developer-schedmd-enhance-software-capabilities/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

Extreme Networks เปิดตัว Wi-Fi 7 AP รุ่นใหม่ พร้อม Agentic AI สำหรับบริหารจัดการระบบเครือข่ายแบบอัตโนมัติ

Extreme Networks ได้ออกมาประกาศถึงอัปเดตครั้งใหญ่ โดยเปิดตัว Wi-Fi 7 Access Point รุ่นใหม่ล่าสุด 5 รุ่น พร้อมนวัตกรรมใหม่ในการบริหารจัดการระบบเครือข่ายด้วย AI Agent เพื่อดูแลรักษาระบบเครือข่ายขององค์กรให้ทำงานได้อย่างต่อเนื่องโดยอัตโนมัติ