NVIDIA เปิดตัว NIM Microservices และ Cloud Endpoints ใหม่ ช่วยองค์กรพัฒนา Generative AI ใช้งานได้สะดวกขึ้น

NVIDIA เปิดตัว API และเครื่องมือใหม่สำหรับการพัฒนาและใช้งาน Generative AI ในงานสัมมนา NVIDIA GTC 2024 ซึ่งจะช่วยให้การพัฒนาและนำเทคโนโลยีดังกล่าวมาใช้งานสะดวกรวดเร็วยิ่งขึ้นตั้งแต่ขั้นตอนการจัดเตรียมข้อมูล ปรับแต่งโมเดล ไปจนถึงการรักษาความปลอดภัยด้วย Guardrails

Nvidia เปิดตัว Microservice พร้อมใช้งานและเครื่องมืออื่นๆสำหรับการพัฒนา Generative AI ในองค์กรซึ่งพัฒนาขึ้นบนแพลตฟอร์ม NVIDIA CUDA ซึ่งประกอบไปด้วย

  • NVIDIA NIM Microservice ต่างๆที่ถูกปรับแต่งมาแล้วให้ทำงานอย่างเต็มประสิทธิภาพร่วมกับโมเดล GenAI จาก NVIDIA และพาร์ทเนอร์รายอื่นๆ โดยใช้ความสามารถจา Triton Inference Server และ TensorRT LLM ช่วยให้การพัฒนาและติดตั้ง AI ได้ในเวลาไม่ถึง 1 ชั่วโมง
  • Microservice สำหรับ SDK, Library, และเครื่องมือในการพัฒนา AI ผ่าน NVIDIA CUDA-X สำหรับการทำ Retrieval-Augmented Generation (RAG), การรักษาความปลอดภัยด้วย Guadrails, การเตรียมและประมวลผลข้อมูล, การเข้าถึงการประมวลผลความเร็วสูง (HPC) และอื่นๆ

โดยการมีเครื่องมือและ Service เหล่านี้เพิ่มเข้ามาทำให้ Ecosystem การพัฒนา AI ของ NVIDIA สมบูรณ์ยิ่งขึ้น เกิดเป็นมาตรฐานในการพัฒนาและเชื่อมต่อโมเดล AI ที่ถูกปรับแต่งมาแล้วเข้ามาใช้งานในองค์กรผ่านแพลตฟอร์มการประมวลผล CUDA ในสถาปัตยกรรม GPU ของ NVIDIA ซึ่งจะช่วยดึงประสิทธิภาพจากฟีเจอร์ต่างๆใน GPU ออกมาได้อย่างเต็มความสามารถ

เครื่องมือต่างๆที่ว่านี้นั้นเปิดให้ใช้งานแล้วผ่าน NVIDIA AI Enterprise 5.0 โดยธุรกิจหลายรายได้เริ่มใช้งานกันแล้ว เช่น Adobe, Getty Images, Shutterstock, และ SAP เป็นต้น 

 

ที่มา: NVIDIA Launches Generative AI Microservices for Developers to Create and Deploy Generative AI Copilots Across NVIDIA CUDA GPU Installed Base

Cover Photo: NVIDIA

Check Also

BOTNOI บริษัทสตาร์ทอัพไทย ได้พัฒนาผู้ช่วยปัญญาประดิษฐ์ที่ใช้ Generative AI รองรับหลายภาษาในภูมิภาคเอเชียตะวันออกเฉียงใต้ โดยใช้บริการคลาวด์ของ AWS [PR]

อะเมซอน เว็บ เซอร์วิสเซส (Amazon Web Services: AWS) บริษัทในเครือของ Amazon.com ประกาศในวันนี้ว่า BOTNOI สตาร์ทอัพด้าน Generative AI ของไทยที่เชี่ยวชาญในการสร้างผู้ช่วยเสมือนจริงสำหรับการสนทนา ได้พัฒนาแพลตฟอร์ม BOTNOI Voice ขึ้นบนคลาวด์ของ AWS เพื่อแปลงข้อความเป็นเสียงพูดและแปลงเสียงพูดเป็นข้อความ โดยใช้เทคโนโลยี Generative AI ที่ได้รับการปรับแต่งให้เหมาะสมกับภาษาและวัฒนธรรมในภูมิภาคเอเชียตะวันออกเฉียงใต้ด้วยข้อมูลภาษาที่ได้รับความยินยอมแล้ว ทำให้องค์กรต่าง ๆ สามารถนำไปใช้ปรับปรุงการบริการลูกค้าได้อย่างมีประสิทธิภาพมากขึ้น

Tenstorrent ระดมทุน 693 ล้านดอลลาร์ ท้าชน Nvidia

Tenstorrent สตาร์ทอัพผลิตชิป AI ที่ตั้งเป้าท้าชิง Nvidia ระดมทุนรอบ Series D นำโดย Samsung Securities และ AFW Partners ได้กว่า …