Nvidia ได้เข้าซื้อกิจการ SchedMD บริษัทขนาดเล็กที่ไม่ค่อยเป็นที่รู้จัก ซึ่งดูแลหนึ่งในเครื่องมือโอเพนซอร์สที่สำคัญที่สุดในระบบนิเวศของแมชชีนเลิร์นนิง

ผู้ผลิตชิปรายนี้ประกาศดีลดังกล่าวโดยไม่ได้เปิดเผยมูลค่าทางการเงิน
SchedMD ก่อตั้งขึ้นในปี 2010 โดยผู้พัฒนา Slurm ซึ่งเป็นแพลตฟอร์มโอเพนซอร์สสำหรับการจัดการคลัสเตอร์เซิร์ฟเวอร์ บริษัทให้บริการระดับมืออาชีพเพื่อช่วยให้องค์กรนำซอฟต์แวร์ไปใช้งานจริงบนโปรดักชัน Nvidia เปิดเผยในวันนี้ว่า SchedMD มีลูกค้าหลายร้อยราย รวมถึงหน่วยงานภาครัฐ ธนาคาร และองค์กรด้านสาธารณสุข
การฝึกโมเดลภาษาขนาดใหญ่บนการ์ดกราฟิกเพียงใบเดียวอาจใช้เวลานานเกินไป ด้วยเหตุนี้ บริษัทต่าง ๆ จึงกระจายภาระงานการฝึกไปยัง GPU จำนวนมาก ซึ่งทำให้สามารถคำนวณแบบขนานได้แทนที่จะทำทีละขั้นตอน วิธีนี้ช่วยประหยัดเวลา แต่ก็สร้างความซับซ้อนในระดับสูง
เมื่อภาระงานการฝึกทำงานบน GPU หลายตัว นักพัฒนาจำเป็นต้องตัดสินใจว่าชิปใดควรรับผิดชอบงานย่อยใด การมอบหมายงานย่อยให้กับชิปที่กำลังยุ่งอยู่แล้วอาจทำให้เกิดความล่าช้าในการฝึกโดยไม่จำเป็น นอกจากนี้ยังมีความท้าทายอื่น ๆ เช่น ความจำเป็นในการหลีกเลี่ยงสถานการณ์ที่ GPU บางส่วนถูกใช้งานไม่เต็มประสิทธิภาพ
Slurm ทำให้งานในการกำหนดว่า GPU ตัวใดควรทำงานใดและเมื่อใดเป็นไปโดยอัตโนมัติ Kubernetes ซึ่งเป็นแพลตฟอร์มโอเพนซอร์สยอดนิยมอีกตัวหนึ่งสำหรับการจัดการคลัสเตอร์ ก็มีความสามารถคล้ายกัน แต่ Slurm มีฟีเจอร์เฉพาะทางหลายอย่างที่ทำให้เหมาะสมกว่าสำหรับการรองรับภาระงานการฝึกปัญญาประดิษฐ์
หนึ่งในจุดเด่นของ Slurm คือความสามารถในการขยายตัวสูง แพลตฟอร์มนี้สามารถจัดการคลัสเตอร์ที่มี GPU มากกว่า 100,000 ตัวได้ อีกทั้งยังมีตัวเลือกการปรับแต่งในระดับละเอียด หากภาระงานสองชุดมีการแลกเปลี่ยนข้อมูลระหว่างกันเป็นประจำ นักพัฒนาสามารถให้ Slurm จัดวางไว้บนเซิร์ฟเวอร์ที่อยู่ติดกันเพื่อลดระยะทางที่ข้อมูลต้องเดินทาง Kubernetes รองรับการปรับแต่งลักษณะนี้เช่นกัน แต่ต้องอาศัยการขยายความสามารถด้วยปลั๊กอิน
SchedMD ช่วยให้องค์กรตั้งค่า Slurm และปรับแต่งให้ตรงตามความต้องการ เมื่อระบบเริ่มใช้งานจริงแล้ว บริษัทจะให้บริการสนับสนุนอย่างต่อเนื่อง เพื่อช่วยลูกค้าในงานต่าง ๆ เช่น การติดตั้งอัปเดต
บริษัทไม่ได้ดูแลเฉพาะ Slurm เท่านั้น แต่ยังดูแลโครงการโอเพนซอร์สอีกตัวหนึ่งชื่อ Slinky ซึ่งช่วยให้องค์กรสามารถรัน Slurm บน Kubernetes ได้ นั่นทำให้ไม่จำเป็นต้องรันแพลตฟอร์มโอเพนซอร์สทั้งสองบนคลัสเตอร์แยกจากกัน ส่งผลให้การจัดการในชีวิตประจำวันง่ายขึ้น นอกจากนี้ การรวมเซิร์ฟเวอร์ไว้ในคลัสเตอร์เดียวกันยังช่วยเพิ่มการใช้ประโยชน์จากฮาร์ดแวร์และลดต้นทุนได้
Nvidia ระบุว่า Slurm จะยังคงเป็นโครงการโอเพนซอร์สต่อไปหลังการเข้าซื้อกิจการ ผู้ผลิตชิปจะพัฒนาโครงการนี้ต่อ และให้บริการระดับมืออาชีพแก่ลูกค้าของ SchedMD
บริษัทยังประกาศแผนที่จะ “เร่งการเข้าถึงระบบใหม่ๆ ให้กับ SchedMD — เพื่อให้ผู้ใช้แพลตฟอร์มการประมวลผลแบบเร่งความเร็วของ Nvidia สามารถปรับแต่งภาระงานได้ทั่วทั้งโครงสร้างพื้นฐานการประมวลผลของตน” ซึ่งบ่งชี้ว่า Nvidia อาจมีแผนในการปรับแต่ง Slurm ให้เหมาะสมกับการ์ดกราฟิกซีรีส์ Rubin ที่กำลังจะมาถึง และหน่วยประมวลผลกลาง Vera
Slurm ไม่ได้ถูกใช้งานเฉพาะในคลัสเตอร์ฝึก AI เท่านั้น แต่ยังใช้ในซูเปอร์คอมพิวเตอร์ด้วย ซอฟต์แวร์นี้ขับเคลื่อนซูเปอร์คอมพิวเตอร์ที่เร็วที่สุด 100 อันดับแรกของโลกมากกว่าครึ่ง ซึ่งหลายระบบก็ใช้ซิลิคอนของ Nvidia ด้วย ความสามารถของบุคลากรที่ Nvidia ได้รับจากการเข้าซื้อ SchedMD อาจช่วยเพิ่มคุณค่าที่เสนอให้กับผู้สร้างซูเปอร์คอมพิวเตอร์ได้มากยิ่งขึ้น
ที่มา: https://siliconangle.com/2025/12/15/nvidia-acquires-slurm-developer-schedmd-enhance-software-capabilities/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






