Google เปิดตัวสองโมเดล AI ใหม่สำหรับหุ่นยนต์

Google ได้เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่สองตัว ได้แก่ Gemini Robotics และ Gemini Robotics-ER ซึ่งได้รับการออกแบบมาเพื่อขับเคลื่อนเครื่องจักรอัตโนมัติ อัลกอริทึมเหล่านี้อ้างอิงจากโมเดลภาษาใหญ่ (LLM) ในซีรีส์ Gemini 2.0 ของบริษัท ซึ่งเปิดตัวเมื่อเดือนธันวาคมที่ผ่านมา LLM เหล่านี้สามารถประมวลผลได้ทั้งข้อความและข้อมูลมัลติโหมดในรูปแบบวิดีโอ ความสามารถนี้ทำให้โมเดล Gemini Robotics และ Gemini Robotics-ER สามารถวิเคราะห์ภาพจากกล้องของหุ่นยนต์เพื่อใช้ในการตัดสินใจได้ Gemini Robotics เป็นโมเดลการมองเห็น-ภาษา-การกระทำ (vision-language-action) โดย Google ระบุว่าหุ่นยนต์ที่ใช้โมเดลนี้สามารถทำงานที่ซับซ้อนได้จากคำสั่งภาษาธรรมชาติ ตัวอย่างเช่น ผู้ใช้สามารถขอให้ AI พับกระดาษเป็นรูปร่างโอริกามิหรือวางสิ่งของลงในถุงซิปล็อคได้ ในอดีต การสอนงานใหม่ให้หุ่นยนต์ในอุตสาหกรรมต้องอาศัยการเขียนโปรแกรมสำหรับงานนั้น ๆ ซึ่งต้องใช้ทักษะเฉพาะทางและใช้เวลามาก เพื่อลดความยุ่งยากในกระบวนการกำหนดค่าหุ่นยนต์ นักวิจัยของ Google ได้ออกแบบ Gemini Robotics โดยคำนึงถึงความครอบคลุม บริษัทระบุว่า AI นี้สามารถทำงานที่ไม่ได้ถูกสอนในระหว่างการฝึก ซึ่งช่วยลดความจำเป็นในการเขียนโปรแกรมเอง เพื่อทดสอบว่า Gemini Robotics สามารถตอบสนองต่อภารกิจใหม่ได้ดีเพียงใด … Continue reading Google เปิดตัวสองโมเดล AI ใหม่สำหรับหุ่นยนต์