NVIDIA ทำลายสถิติ Performance ในการเทรนระบบ AI ทั้งหมด 16 รายการ จาก A100 Tensor Core GPU และระบบคลัสเตอร์ DGX SuperPOD System ในการวัดผลของ MLPerf Benchmarks ครั้งล่าสุดที่ถูกเผยออกมาเมื่อปลายเดือนกรกฎาคมที่ผ่านมา

MLPerf นั้นเป็น Benchmarks ด้านประสิทธิภาพในการเทรน AI ซึ่งมีองค์กรอย่าง Amazon, Baidu, Facebook, Google และองค์กรและสถาบันอื่นๆให้การสนับสนุน โดยในปีนี้ การทดสอบความเร็วของการเทรนนิ่ง AI แบ่งออกเป็น 8 หัวข้อ ได้แก่ การจำแนกประเภทของภาพ, การตรวจจับวัตถุ (Light), การแปลแบบ Recurrent, การตรวจจับวัตถุ (Heavy), และการแปลแบบ Non-recurrent, Reinforcement Learning ด้วยเกมโกะขนาดย่อ, และอีก 2 หัวข้อที่เพิ่งเพิ่มเข้ามาใหม่ในปีนี้ ได้แก่ ระบบ Recommendation และ AI สนทนา
ในการวัดผลแบบรายชิปในหมวดผลิตภัณฑ์ที่วางขายในตลาด (Commercially Available) A100 Tensor Core GPU ของ NVIDIA มี Performance ที่สูงสุดในการทดสอบทั้ง 8 ประเภท และเมื่อนำไปเทียบกับ V100 GPU ของ NVIDIA ที่ได้รับการทดสอบในการทดสอบครั้งแรกของ MLPerf เมื่อราว 1.5 ปีที่แล้ว GPU ของ NVIDIA มีความเร็วเพิ่มสูงสุดถึง 4 เท่าจากเดิม
ด้านการทดสอบระบบในสเกลขนาดใหญ่ DGX SuperPOD System ระบบซึ่งเป็นคลัสเตอร์ของ DGX A100 ที่เชื่อมต่อเข้าด้วยกันผ่าน HDR InfiniBand ก็สามารถทำลายสถิติทั้ง 8 ได้เช่นกัน โดยจากสถาปัตยกรรม DGX SuperPOD นี้ NVIDIA ได้สร้างคลัสเตอร์ Selene ในองค์กร ซึ่งเพิ่งได้รับการจัดอันดับให้อยู่ใน Top 500 ของระบบอุตสาหกรรมในสหรัฐอเมริกา
ปัจจุบัน A100 นั้นเป็น GPU ที่มีการให้บริการโดยผู้ให้บริการรายใหญ่หลายราย เช่น Google Cloud, AWS, Baidu cloud, Microsoft Azure, และ Tencent Cloud อีกทั้งยังอยู่ในเซิฟเวอร์ของผู้ผลิตรายใหญ่หลายราย เช่น Dell Technologies, Hewlett Packard Enterprise, Inspur, และ Supermicro
ที่มา: https://blogs.nvidia.com/blog/2020/07/29/mlperf-training-benchmark-records/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






