CDIC 2023

NVIDIA เปิดตัว DGX Cloud Platform และ AI Foundations Model สำหรับ Gen-AI

NVIDIA เปิดตัว DGX Cloud Platform และ AI Foundations Model สำหรับ Gen-AI พร้อมเริ่มต้นใช้งานได้อย่างรวดเร็ว

Credit: NVIDIA

ในงาน GTC ที่กำลังจัดขึ้น NVIDIA ได้ประกาศเปิดตัวบริการ NVIDIA DGX Cloud บริการ Cloud-hosted สำหรับ DGX Platform ช่วยตอบโจทย์การใช้งาน AI Training สำหรับองค์กร โดย DGX Cloud Instance ประกอบด้วย NVIDIA H100 หรือ A100 จำนวน 8 ตัว มีประสิทธิภาพในการประมวลผล 80 GB Tensor Core GPU, 640 GB Memory ต่อ 1 node ซึ่งเพียงพอต่อโครงการ AI ขนาดใหญ่ ในช่วงเริ่มต้นนี้ NVIDIA กำลังร่วมมือกับพาร์ทเนอร์หลายรายเพื่อให้บริการ DGX Cloud Service เช่น Microsoft และ Google โดยมี Oracle Cloud เป็นพาร์ทเนอร์รายแรกที่ให้บริการโซลูชันนี้ มีค่าบริการอยู่ที่ 36,999 เหรียญต่อเดือน

NVIDIA ยังได้ประกาศเปิดตัว NVIDIA AI Foundations บริการ Cloud AI Service ประกอบด้วย NVIDIA NeMo – Language Service และ NVIDIA Picasso – Image, Video และ 3D Service โดยทั้งสองบริการถูกออกแบบมาสำหรับสร้าง Generative AI Application เพื่อต่อยอดเป็นบริการอื่นขององค์กร เช่น Intelligent Chat, Content Creation และ Digital Simulation นักพัฒนาสามารถปรับแต่ง Foundation Models ให้เหมาะสมกับข้อมูลขององค์กรได้เอง สำหรับบริการนี้ประกอบด้วย 6 ส่วนสำคัญ ได้แก่ Pretrained Models, Framework สำหรับ Data processing, Vector Databases และ personalization, Optimized Inference Engine, API, และบริการ Support จาก NVIDIA

ปัจจุบัน NeMo Service อยู่ในช่วง Early Access ส่วน Picasso นั้นอยู่ในช่วง Private Preview องค์กรที่สนใจสามารถเข้าร่วมทดลองใช้งานบริการนี้ได้แล้ว

ที่มา: https://siliconangle.com/2023/03/21/nvidia-unveils-dgx-cloud-platform-generative-ai-training/


About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนมือใหม่ผู้หลงใหลใน Enterprise IT และซูชิ

Check Also

AWS ปล่อยชิปใหม่ Trainium 2 สำหรับงาน AI และ Gravition4 ปลดล็อกจำกัดของงานแบบเดิม

สำหรับงาน re:invent ของ AWS ฝั่งของชิปที่ขาดตลาดเป็นอย่างมากก็น่าสนใจไม่น้อย ซึ่ง AWS ได้เปิดตัวเตรียมส่ง Trainium 2 ลงสนามพร้อมวัดผลกับงาน AI ที่กำลังมาแรง นอกจากนี้ยังเปิดตัว Gravition …

AWS ออก S3 Express One Zone ประสิทธิภาพดีกว่าเดิม 10 เท่า

ที่งาน re:Invent เมื่อไม่กี่วันที่ผ่านมาได้มีการปล่อยบริการใหม่ออกมาจำนวนมา ซึ่งหนึ่งในหมวดที่น่าสนใจตัวหนึ่งก็คือ S3 Express One Zone โดยเมื่อเทียบกับ S3 แบบเดิมแล้วทาง AWS ชี้ว่าสามารถให้ประสิทธิภาพได้สูงขึ้นถึง 10 เท่า …