NVIDIA เข้าซื้อกิจการ SchedMD ผู้พัฒนา Slurm เสริมศักยภาพซอฟต์แวร์สำหรับ AI Workload

NVIDIA ประกาศเข้าซื้อกิจการ SchedMD ผู้พัฒนาและดูแล Slurm ซึ่งเป็น open-source software สำหรับบริหารจัดการ cluster ที่สำคัญที่สุดตัวหนึ่งในระบบนิเวศ machine learning

Credit: NVIDIA

SchedMD ก่อตั้งขึ้นในปี 2010 โดยทีมพัฒนา Slurm ซึ่งเป็น open-source platform สำหรับบริหารจัดการ server cluster บริษัทให้บริการ professional services ช่วยองค์กรนำซอฟต์แวร์ไปใช้งานจริงในระบบ production โดย NVIDIA เปิดเผยว่า SchedMD มีลูกค้าหลายร้อยราย รวมถึงหน่วยงานรัฐบาล ธนาคาร และองค์กรด้านสาธารณสุข ทั้งนี้ไม่มีการเปิดเผยมูลค่าของดีลนี้

Slurm มีความสำคัญอย่างมากสำหรับการ train AI model เนื่องจากการ train large language model บน GPU เพียงตัวเดียวต้องใช้เวลานานมาก องค์กรจึงต้องกระจาย workload ไปยัง GPU จำนวนมากเพื่อประมวลผลแบบ parallel โดย Slurm จะจัดการว่า GPU ตัวไหนควรทำงานอะไรและเมื่อไหร่ ป้องกันไม่ให้ chip บางตัวทำงานหนักเกินไปหรือถูกใช้งานต่ำกว่าที่ควร จุดเด่นของ Slurm คือสามารถบริหารจัดการ cluster ที่มี GPU มากกว่า 100,000 ตัวได้ และยังมีตัวเลือกการปรับแต่งที่ละเอียด เช่น การจัด workload ที่ต้องแลกเปลี่ยนข้อมูลกันบ่อยให้อยู่บน server ที่อยู่ใกล้กันเพื่อลด latency

นอกจาก Slurm แล้ว SchedMD ยังดูแลอีกโปรเจกต์หนึ่งชื่อ Slinky ที่ช่วยให้รัน Slurm บน Kubernetes ได้ ทำให้ไม่ต้องแยก cluster ออกเป็นสองระบบ ช่วยลดความซับซ้อนในการบริหารจัดการและเพิ่มประสิทธิภาพการใช้งานฮาร์ดแวร์ NVIDIA ระบุว่า Slurm จะยังคงเป็น open-source project ต่อไป และบริษัทจะพัฒนาโปรเจกต์นี้ต่อพร้อมให้บริการ professional services แก่ลูกค้าของ SchedMD ปัจจุบัน Slurm ขับเคลื่อน supercomputer มากกว่าครึ่งหนึ่งของ 100 เครื่องที่เร็วที่สุดในโลก ซึ่งหลายเครื่องก็ใช้ชิปของ NVIDIA อยู่แล้ว

ที่มา: https://siliconangle.com/2025/12/15/nvidia-acquires-slurm-developer-schedmd-enhance-software-capabilities/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Red Hat Enterprise Linux เวอร์ชันล่าสุด ชูจุดเด่นความพร้อมรับมือ Post-Quantum มาพร้อมระบบอัตโนมัติที่ขับเคลื่อนด้วย AI [PR]

เร้ดแฮทผู้นำด้านโซลูชันโอเพ่นซอร์สระดับโลก ประกาศเตรียมเปิดตัว Red Hat Enterprise Linux 10.2 และ 9.8 ต่อยอดจากนวัตกรรมของ Red Hat Enterprise Linux 10 …

HPE ยกระดับเครือข่ายอัตโนมัติสู่การใช้งานจริง เปิดตัวความสามารถใหม่ ขับเคลื่อนการดำเนินงานแบบ AI-Native ที่ปลอดภัยและรวดเร็ว [PR]

HPE ประกาศเปิดตัวความสามารถใหม่ด้านเครือข่ายอัตโนมัติ ตอกย้ำความเป็นผู้นำในฐานะผู้ให้บริการรายแรกและรายเดียวของอุตสาหกรรมเครือข่าย AIOps แบบอัตโนมัติเต็มรูปแบบ พร้อมการทำงานเชิงเอเจนต์ (Agentic) การเปิดตัวความสามารถใหม่ของระบบการทำงานแบบอัตโนมัติใน HPE Mist และ HPE Aruba Central ทำให้ …