NVIDIA ได้ประกาศเปิดตัว CUDA 8 สำหรับใช้พัฒนาโปรแกรมเพื่องานประมวลผลประสิทธิภาพสูงแบบ Parallel โดยเฉพาะเป็นที่เรียบร้อย โดยมีฟีเจอร์ใหม่ๆ ดังนี้
- รองรับ GPU สถาปัตยกรรม Pascal ได้แก่ NVIDIA Tesla P100, P40 และ P4
- รองรับการทำ Unified Memory ได้ดีขึ้น โดยสามารถ Port โค้ดจาก CPU Parallel มาใช้ GPU ได้ง่ายขึ้น โดยรองรับ Address Space และ Page Faulting ขนาดใหญ่ได้
- ประมวลผล FP16 และ INT8 ได้แบบ Native ทำให้ทำ Deep Learning และงานประมวลผลเฉพาะทางได้ดีขึ้น
- เพิ่ม Library ใหม่ nvGRAPH GPU-Accelerated Graph Analyitcs เข้ามา สร้างกราฟจากข้อมูลขนาดใหญ่ได้เร็วขึ้นกว่าเดิมมากกว่า 200 เท่า
- เพิ่ม Visual Profiler วิเคราะห์ Dependency ของการใช้ GPU และ CPU ในโค้ดให้เข้าใจได้ง่ายขึ้น และปรับปรุงประสิทธิภาพได้ดีขึ้น
- NVCC Compiler ทำงานได้เร็วขึ้น
- รองรับการทำ GPU Lambda แบบ Heterogeneous ได้แล้ว
ผู้ที่สนใจสามารถโหลด CUDA Toolkit ได้ที่ http://developer.nvidia.com/cuda-toolkit เลยนะครับ
ที่มา: https://devblogs.nvidia.com/parallelforall/cuda-8-features-revealed/