GIGABYTE เปิดตัวพอร์ตฟอลิโอของ HPC เซิร์ฟเวอร์ G-series ที่รองรับ NVIDIA A100 PCIe GPUs

พร้อมกันกับการเปิดตัวของ NVIDIA A100 PCIe GPU, GIGABYTE ผู้นำในอุตสาหกรรมเซิร์ฟเวอร์และเวิร์กสเตชันประสิทธิภาพสูงได้ประกาศ ผลการตรวจสอบความเข้ากันได้ของ GIGABYTE High Performance Computing (HPC) G-Series Server รุ่น G481-HA0 และ G292-Z40 กับ NVIDIA A100 GPU และได้เพิ่ม NVIDIA A100 เข้าสู่ Support List ของเซิร์ฟเวอร์ทั้งสองรุ่นนี้

เซิร์ฟเวอร์ G-series ที่เหลือถูกแบ่งออกเป็นสองชุด เพื่อทำการทดสอบและยืนยันความเข้ากันได้อย่างเป็นทางการในไม่ช้า

NVIDIA A100 PCIe GPU Compatibility Validation Plan

Max GPU

6/22

2nd wave

3rd wave

2 x A100

R281-3C2

3 x A100

R282-Z93

R281-G30

4 x A100

G191-H44

8 x A100

G292-Z40

G292-Z20
G482-Z52

G291-280
G291-281

10 x A100

G481-HA0
G492-Z50
G492-Z51

ในขณะเดียวกัน GIGABYTE ยังได้เปิดตัวเซิร์ฟเวอร์ซีรี่ย์ G492 ใหม่ซึ่งใช้โปรเซสเซอร์ตระกูล AMD EPYC 7002 ซึ่งสนับสนุน PCIe Gen4 สำหรับ NVIDIA A100 PCIe GPU ถึง 10 ตัวด้วยกัน G492 เป็นเซิร์ฟเวอร์ที่มีความสามารถในการคำนวณสูงสุดสำหรับ AI Training ในตลาดวันนี้ GIGABYTE ได้นำเสนอ SKU สองแบบสำหรับ G492 ซีรี่ย์, G492-Z50 จะอยู่ที่จุดราคาที่เข้าถึงได้มากกว่า ในขณะที่ G492-Z51 เน้นประสิทธิภาพที่สูงขึ้น

G492 เป็นเซิร์ฟเวอร์ 4U G-series รุ่นที่สองของ GIGABYTE จากพื้นฐานการออกแบบเซิร์ฟเวอร์ 4U G-series รุ่นแรก G481 (Intel) และ G482 (AMD) ซึ่งเป็นการออกแบบที่ให้ใช้งานง่ายและเพิ่มความสามารถในการปรับขยายได้นั้น ได้รับการปรับให้เหมาะสมยิ่งขึ้น นอกเหนือจากการรองรับโปรเซสเซอร์ AMD EPYC 7002 แล้ว ช่องเสียบหน่วยความจำ DDR4 ทั้ง 32 ช่องยังรองรับหน่วยความจำสูงสุดถึง 8TB ที่ความเร็ว 3200MHz G492 มีสวิตช์ PCIe Gen4 ในตัวซึ่งสามารถเพิ่มเลน PCIe Gen4 ได้มากขึ้น PCIe Gen4 มีประสิทธิภาพ I/O เป็นสองเท่าของ PCIe Gen3 และเปิดใช้งานพลังการประมวลผลของ NVIDIA A100 Tensor Core GPU อย่างเต็มที่

ด้วย NVIDIA GPU Acceleration ได้กลายเป็นเทคโนโลยีหลักในดาต้าเซ็นเตอร์ นักวิทยาศาสตร์ นักวิจัยและวิศวกร มุ่งมั่นที่จะใช้ HPC และ AI ที่เร่งด้วย GPU มาตอบสนองความท้าทายที่สำคัญของโลกปัจจุบัน ตามที่ NVIDIA ระบุว่า A100 Tensor Core GPU นั้นมอบประสิทธิภาพที่ก้าวกระโดดสูงสุดเมื่อเทียบกับรุ่นก่อนหน้า A100 PCIe GPU ยังคงรักษาโปรไฟล์ 250W TDP และการออกแบบเชิงกลเหมือนกับ V100 GPU รุ่นก่อนแต่เพิ่มความจุหน่วยความจำ HBM2 เป็น 40GB ความเร็วของการใช้ TensorFloat-32 (TF32) สำหรับ AI Training, NVIDIA A100 มีประสิทธิภาพเป็นหกเท่าของ V100 A100 สามารถจัดการกับการประมวลผลแบบ AI เพิ่มขึ้นอย่างรวดเร็วทั้งขนาดและความซับซ้อน โดยไม่ต้องเปลี่ยนรหัสใดๆ

BERT pre-training throughput using Pytorch, including (2/3) Phase 1 and (1/3) Phase 2 | Phase 1 Seq Len = 128, Phase 2 Seq Len = 512; V100: NVIDIA DGX-1™ server with 8x V100 using FP32 precision; A100: DGX A100 Server with 8x A100 using TF32 precision.

เซิร์ฟเวอร์ G492 ได้รับการออกแบบมาเป็นอย่างดีเพื่อรองรับ NVIDIA A100 PCIe GPU, GIGABYTE ได้สร้าง PCIe Gen4 Switch ในระบบเพื่อสร้างเครือข่าย PCIe Mesh ความเร็วสูงรองรับการสื่อสารแบบ GPUDirect Peer-to-peer (P2P) ระหว่าง GPU และเทคโนโลยี RDMA เพื่อขนานกับคลัสเตอร์คอมพิวเตอร์ขนาดใหญ่ขึ้น.  GPU แต่ละตัวสามารถเข้าถึงหน่วยความจำของ GPU อื่นๆ โดยตรงผ่าน GPUDirect P2P ผ่าน PCIe Bus ช่วยลดการถ่ายโอนข้อมูลไปยังหน่วยความจำระบบของเซิร์ฟเวอร์และเพิ่มความเร็วในการแลกเปลี่ยนข้อมูล

ยกตัวอย่าง Deep Learning แพลตฟอร์ม เช่น TensorFlow และ MXNet ให้การสนับสนุน GPUDirect P2P และNVIDIA Collective Communication Library (NCCL) ก็ถูกปรับให้เหมาะสำหรับ GPUDirect P2P

การขยายเลน PCIe Gen4 ผ่าน PCIe Gen4 Switches ทำให้ความสามารถในการขยาย ของ G492 สูงกว่าเซิร์ฟเวอร์ G481 และ G482 ก่อนหน้านี้มาก นอกเหนือจากการมี 10 Dual-slot A100 GPUs ในแชสซี ยังมี PCIe x16 สามช่องและ OCP 3.0 หนึ่งช่องที่ด้านหน้าและด้านหลังของแชสซีให้ผู้ใช้มีตัวเลือกอัปเกรดการ์ดเสริม เช่น การ์ด SAS หรือ การ์ด NVIDIA Mellanox InfiniBand เพิ่มเติม ความน่าสนใจของ G492 เซิร์ฟเวอร์ซีรี่ย์ G492 อยู่ที่ Cost Per Performance ที่ต่ำ และความยืดหยุ่นสูงสำหรับผู้ใช้ในการกำหนดค่าด้วยตนเองและขยายขีดความสามารถในการคำนวณตามความต้องการ

GIGABYTE จะขยายระบบ NGC-Ready ในเร็ว ๆ นี้พร้อมๆกับ NVIDIA A100 GPUs. ระบบ NGC-Ready ถูกสร้างขึ้นสำหรับแอปพลิเคชั่น AI และได้รับการทดสอบการใช้งานและประสิทธิภาพของ Deep Learning และ Machine Learning โดยใช้ GPU-optimized ซอฟต์แวร์ จาก NVIDIA’s NGC Registry ช่วยให้ผู้ดูแลระบบมั่นใจในการใช้โครงสร้างพื้นฐานที่จำเป็นสำหรับการใช้งานแอปพลิเคชัน AI

ในแง่ของการกำหนดค่าการจัดเก็บข้อมูล G492 สามารถติดตั้งฮาร์ดไดรฟ์ขนาด 3.5” หรือ 2.5” ถึง 12 ตัว ตัวบอร์ด Backplane รองรับโปรโตคอล SATA/SAS/NVMe ดังนั้นนอกเหนือจาก Large Cluster G492 ยังเหมาะสำหรับโครงสร้างพื้นฐานขององค์กรทั่วไปหรือห้องปฏิบัติการวิจัยที่ต้องเก็บข้อมูลให้มั่นคงปลอดภัย เซิร์ฟเวอร์ G492 และ NVIDIA A100 PCIe GPUs สามารถมอบพลังการประมวลผลที่ปฏิวัติวงการสำหรับงาน AI ทุกขนาด เร่งปริมาณงานทุกขนาดและช่วยให้ลูกค้าลดเวลาในการนำบริการของพวกเขาออกสู่ตลาด

เรียนรู้เพิ่มเติมเกี่ยวกับเซิร์ฟเวอร์ GIGABYTE G-series และ NVIDIA A100 GPU ได้ที่ https://www.gigabyte.com สอบถามรายละเอียดเพิ่มเติมหรือความช่วยเหลือติดต่อเราโดยตรงผ่าน server.grp@gigabyte.com



About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

[Video Webinar] Cyber Threat Alliance – Making the Impossible Possible and WAN Edge Transformation

สำหรับผู้ที่ไม่ได้เข้าฟังการบรรยาย Webinar เรื่อง “Cyber Threat Alliance – Making the Impossible Possible and WAN Edge Transformation” …

[Video Webinar] Detecting Ransomware with Veeam by CSL

สำหรับผู้ที่ไม่ได้เข้าฟังการบรรยาย CSL Webinar เรื่อง “Detecting Ransomware with Veeam” เพื่อเรียนรู้การปกป้องข้อมูลจาก Ransomware และการปรับปรุงแผน Business Continuity ให้รองรับกับปริมาณข้อมูลที่เพิ่มมากขึ้น และสอดคล้องกับ …