NVIDIA ประกาศเปิดตัว NeMo microservices แบบ General Availability อย่างเป็นทางการ พร้อมสำหรับการใช้งานจริงในระดับองค์กรแล้ว หลังผ่านการทดสอบและพัฒนาจนมีความเสถียร ช่วยให้นักพัฒนาสามารถสร้าง AI Agent ได้อย่างมีประสิทธิภาพ

การประกาศ General Availability ของ NeMo microservices นับเป็นก้าวสำคัญเนื่องจากแสดงให้เห็นว่าเครื่องมือชุดนี้ไม่ได้อยู่ในขั้นตอนการทดสอบหรือ preview อีกต่อไป แต่ได้รับการพัฒนาจนพร้อมสำหรับการใช้งานจริงและได้รับการสนับสนุนเต็มรูปแบบจาก NVIDIA ในยุคที่ AI Agent กำลังกลายเป็นเครื่องมือสำคัญสำหรับเพิ่มประสิทธิภาพการทำงานในองค์กร เครื่องมือเหล่านี้ถูกออกแบบมาเพื่อช่วยให้วิศวกร AI สามารถพัฒนา “digital teammates” ได้อย่างรวดเร็ว เพื่อช่วยในการค้นหาข้อมูล ทำงานตามคำสั่ง และทำงานเชิงรุกโดยอัตโนมัติ
NeMo microservices ที่เปิดให้ใช้งานเชิงพาณิชย์อย่างเต็มรูปแบบแล้วประกอบด้วยเครื่องมือหลายตัว ได้แก่:
- Customizer: ช่วยในการ fine-tune โมเดลภาษาขนาดใหญ่โดยเพิ่มประสิทธิภาพการฝึกฝนได้สูงถึง 1.8 เท่า
- Evaluator: ช่วยประเมินโมเดล AI และ workflows ตามเกณฑ์ที่กำหนดเองหรือเกณฑ์มาตรฐานอุตสาหกรรมด้วย API เพียง 5 คำสั่ง
- Guardrails: ทำงานควบคู่กับโมเดล AI เพื่อป้องกันพฤติกรรมที่ไม่ปลอดภัยหรือนอกขอบเขตที่กำหนด เพิ่มประสิทธิภาพการทำงานได้ 1.4 เท่า
- Retriever: ช่วยให้นักพัฒนาสามารถสร้าง Agent ที่สามารถดึงข้อมูลจากระบบต่างๆ และประมวลผลได้อย่างแม่นยำ
- Curator: ช่วยในการจัดการและปรับแต่งข้อมูลสำหรับการฝึกฝนโมเดล
NVIDIA ยังออกแบบให้ NeMo tools สามารถเข้าถึงได้ง่ายผ่าน API calls สำหรับนักพัฒนาที่มีความรู้ด้าน AI ทั่วไป เพื่อให้สามารถสร้างและใช้งาน AI Agent ได้อย่างรวดเร็ว ปัจจุบันองค์กรต่างๆ กำลังเริ่มสร้างระบบ multi-agent ที่ซับซ้อน ซึ่ง Agent ร้อยหรือพันตัวสามารถทำงานร่วมกันเพื่อบรรลุเป้าหมายร่วมกันในขณะที่ทำงานควบคู่ไปกับมนุษย์
NeMo microservices ที่ออกสู่ตลาดอย่างเป็นทางการแล้วนี้รองรับโมเดล AI แบบเปิดที่ได้รับความนิยมหลายตัว เช่น Llama จาก Meta, Microsoft Phi, Google Gemma และ Mistral รวมถึง Llama Nemotron Ultra ของ NVIDIA ซึ่งครองอันดับหนึ่งด้านการให้เหตุผลทางวิทยาศาสตร์ การเขียนโค้ด และการคำนวณทางคณิตศาสตร์ที่ซับซ้อน
ผู้ให้บริการ AI ชั้นนำหลายรายได้นำ NeMo microservices มาใช้ในแพลตฟอร์มของตนแล้ว เช่น Cloudera, Datadog, Dataiku, DataRobot, DataStax, SuperAnnotate AI และ Weights & Biases นักพัฒนาสามารถเริ่มใช้ microservices เหล่านี้ผ่าน AI frameworks ยอดนิยม เช่น CrewAI, Haystack by Deepset, LangChain, LlamaIndex และ Llamastack ตัวอย่างองค์กรที่ใช้ NeMo microservices เช่น AT&T ที่ใช้ NeMo Customizer และ Evaluator เพิ่มความแม่นยำของ AI Agent โดย fine-tune โมเดล Mistral 7B สำหรับบริการส่วนบุคคล การป้องกันการฉ้อโกง และการปรับประสิทธิภาพเครือข่าย ส่วน BlackRock กำลังทำงานร่วมกับ microservices ในแพลตฟอร์ม Aladdin เพื่อรวมการจัดการการลงทุนผ่านภาษาข้อมูลที่เป็นมาตรฐานเดียวกัน