NVIDIA เปิดตัว NIM Microservices และ Cloud Endpoints ใหม่ ช่วยองค์กรพัฒนา Generative AI ใช้งานได้สะดวกขึ้น

NVIDIA เปิดตัว API และเครื่องมือใหม่สำหรับการพัฒนาและใช้งาน Generative AI ในงานสัมมนา NVIDIA GTC 2024 ซึ่งจะช่วยให้การพัฒนาและนำเทคโนโลยีดังกล่าวมาใช้งานสะดวกรวดเร็วยิ่งขึ้นตั้งแต่ขั้นตอนการจัดเตรียมข้อมูล ปรับแต่งโมเดล ไปจนถึงการรักษาความปลอดภัยด้วย Guardrails

Nvidia เปิดตัว Microservice พร้อมใช้งานและเครื่องมืออื่นๆสำหรับการพัฒนา Generative AI ในองค์กรซึ่งพัฒนาขึ้นบนแพลตฟอร์ม NVIDIA CUDA ซึ่งประกอบไปด้วย

  • NVIDIA NIM Microservice ต่างๆที่ถูกปรับแต่งมาแล้วให้ทำงานอย่างเต็มประสิทธิภาพร่วมกับโมเดล GenAI จาก NVIDIA และพาร์ทเนอร์รายอื่นๆ โดยใช้ความสามารถจา Triton Inference Server และ TensorRT LLM ช่วยให้การพัฒนาและติดตั้ง AI ได้ในเวลาไม่ถึง 1 ชั่วโมง
  • Microservice สำหรับ SDK, Library, และเครื่องมือในการพัฒนา AI ผ่าน NVIDIA CUDA-X สำหรับการทำ Retrieval-Augmented Generation (RAG), การรักษาความปลอดภัยด้วย Guadrails, การเตรียมและประมวลผลข้อมูล, การเข้าถึงการประมวลผลความเร็วสูง (HPC) และอื่นๆ

โดยการมีเครื่องมือและ Service เหล่านี้เพิ่มเข้ามาทำให้ Ecosystem การพัฒนา AI ของ NVIDIA สมบูรณ์ยิ่งขึ้น เกิดเป็นมาตรฐานในการพัฒนาและเชื่อมต่อโมเดล AI ที่ถูกปรับแต่งมาแล้วเข้ามาใช้งานในองค์กรผ่านแพลตฟอร์มการประมวลผล CUDA ในสถาปัตยกรรม GPU ของ NVIDIA ซึ่งจะช่วยดึงประสิทธิภาพจากฟีเจอร์ต่างๆใน GPU ออกมาได้อย่างเต็มความสามารถ

เครื่องมือต่างๆที่ว่านี้นั้นเปิดให้ใช้งานแล้วผ่าน NVIDIA AI Enterprise 5.0 โดยธุรกิจหลายรายได้เริ่มใช้งานกันแล้ว เช่น Adobe, Getty Images, Shutterstock, และ SAP เป็นต้น 

 

ที่มา: NVIDIA Launches Generative AI Microservices for Developers to Create and Deploy Generative AI Copilots Across NVIDIA CUDA GPU Installed Base

Cover Photo: NVIDIA

Check Also

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ

Ericsson เปิดตัวโซลูชัน AI in RAN ยกระดับ 5G ไปอีกขั้นด้วยโครงข่ายที่ฝัง AI อยู่ภายใน

Ericsson เปิดตัว AI in RAN ซอฟต์แวร์แบบ Subscription ล่าสุดที่ฝัง AI ลงในแพลตฟอร์ม Radio Access Network (RAN) โดยตรง …