Google เปิดตัวสองโมเดล AI ใหม่สำหรับหุ่นยนต์

March 13, 2025 AI, Business Software, Cloud and Systems, Google, Products, Robot

Google ได้เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่สองตัว ได้แก่ Gemini Robotics และ Gemini Robotics-ER ซึ่งได้รับการออกแบบมาเพื่อขับเคลื่อนเครื่องจักรอัตโนมัติ

อัลกอริทึมเหล่านี้อ้างอิงจากโมเดลภาษาใหญ่ (LLM) ในซีรีส์ Gemini 2.0 ของบริษัท ซึ่งเปิดตัวเมื่อเดือนธันวาคมที่ผ่านมา LLM เหล่านี้สามารถประมวลผลได้ทั้งข้อความและข้อมูลมัลติโหมดในรูปแบบวิดีโอ ความสามารถนี้ทำให้โมเดล Gemini Robotics และ Gemini Robotics-ER สามารถวิเคราะห์ภาพจากกล้องของหุ่นยนต์เพื่อใช้ในการตัดสินใจได้

Gemini Robotics เป็นโมเดลการมองเห็น-ภาษา-การกระทำ (vision-language-action) โดย Google ระบุว่าหุ่นยนต์ที่ใช้โมเดลนี้สามารถทำงานที่ซับซ้อนได้จากคำสั่งภาษาธรรมชาติ ตัวอย่างเช่น ผู้ใช้สามารถขอให้ AI พับกระดาษเป็นรูปร่างโอริกามิหรือวางสิ่งของลงในถุงซิปล็อคได้

ในอดีต การสอนงานใหม่ให้หุ่นยนต์ในอุตสาหกรรมต้องอาศัยการเขียนโปรแกรมสำหรับงานนั้น ๆ ซึ่งต้องใช้ทักษะเฉพาะทางและใช้เวลามาก เพื่อลดความยุ่งยากในกระบวนการกำหนดค่าหุ่นยนต์ นักวิจัยของ Google ได้ออกแบบ Gemini Robotics โดยคำนึงถึงความครอบคลุม บริษัทระบุว่า AI นี้สามารถทำงานที่ไม่ได้ถูกสอนในระหว่างการฝึก ซึ่งช่วยลดความจำเป็นในการเขียนโปรแกรมเอง

เพื่อทดสอบว่า Gemini Robotics สามารถตอบสนองต่อภารกิจใหม่ได้ดีเพียงใด Google ได้ประเมินโมเดลโดยใช้เกณฑ์วัดความสามารถทั่วไปของ AI ผลลัพธ์พบว่าอัลกอริทึมนี้มีประสิทธิภาพมากกว่าโมเดลการมองเห็น-ภาษา-การกระทำรุ่นก่อนหน้าถึงสองเท่า ตามที่ Google ระบุ Gemini Robotics ไม่เพียงแต่สามารถทำงานที่ไม่ได้ถูกสอนให้ทำเท่านั้น แต่ยังสามารถปรับเปลี่ยนวิธีการดำเนินงานเมื่อสภาพแวดล้อมเปลี่ยนแปลงได้

“หากวัตถุหลุดจากการจับของหุ่นยนต์ หรือมีคนขยับสิ่งของ Gemini Robotics สามารถปรับแผนใหม่และดำเนินงานต่อไปได้ ซึ่งเป็นความสามารถที่สำคัญสำหรับหุ่นยนต์ในโลกความเป็นจริงที่เต็มไปด้วยความไม่แน่นอน” Carolina Parada หัวหน้าฝ่ายหุ่นยนต์ของ Google DeepMind กล่าวในบล็อกโพสต์

โมเดล AI ใหม่อีกตัวที่เปิดตัวในวันนี้คือ Robotics-ER ซึ่งได้รับการออกแบบมาเพื่อรองรับการให้เหตุผลเชิงพื้นที่ แนวคิดนี้หมายถึงกระบวนการคำนวณที่ซับซ้อนที่หุ่นยนต์ต้องดำเนินการก่อนทำงาน เช่น การหยิบแก้วกาแฟต้องอาศัยแขนกลในการค้นหาหูจับและคำนวณมุมที่เหมาะสมสำหรับการหยิบจับ

หลังจากวางแผนการดำเนินงานเสร็จสิ้น Gemini Robotics-ER จะใช้ความสามารถด้านการเขียนโค้ดของ Gemini 2.0 เพื่อแปลงแผนให้เป็นสคริปต์การกำหนดค่า ซึ่งใช้ในการตั้งค่าหุ่นยนต์ที่ติดตั้ง AI นี้ หากงานใดซับซ้อนเกินไปสำหรับ Gemini Robotics-ER นักพัฒนาสามารถสอน AI เกี่ยวกับแนวทางที่ดีที่สุดโดยใช้ “ตัวอย่างจากมนุษย์เพียงไม่กี่ครั้ง”

“Gemini Robotics-ER สามารถดำเนินกระบวนการควบคุมหุ่นยนต์ได้อย่างครบวงจร ตั้งแต่การรับรู้ การประมาณสถานะ ความเข้าใจเชิงพื้นที่ การวางแผน และการสร้างโค้ด” Parada เขียน “ในสภาพแวดล้อมที่ครอบคลุมแบบนี้ โมเดลสามารถเพิ่มอัตราความสำเร็จได้ 2-3 เท่าเมื่อเทียบกับ Gemini 2.0”

Google จะเปิดให้พันธมิตรหลายรายเข้าถึง Gemini Robotics-ER รวมถึง Apptronik สตาร์ทอัพด้านหุ่นยนต์ฮิวแมนนอยด์ที่เพิ่งระดมทุนได้ 350 ล้านดอลลาร์เมื่อเดือนที่แล้ว ซึ่งในรอบการลงทุนดังกล่าว Google ได้เข้าร่วมเป็นนักลงทุนด้วย และจะร่วมมือกับ Apptronik ในการพัฒนาหุ่นยนต์ฮิวแมนนอยด์ที่ใช้ Gemini 2.0

ที่มา: https://siliconangle.com/2025/03/12/google-debuts-two-new-ai-models-powering-robots/

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้

TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

Google เปิดตัวสองโมเดล AI ใหม่สำหรับหุ่นยนต์

About นักเขียนฝึกหัดหมายเลขเก้า

Related Articles

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Google เปิดตัวสองโมเดล AI ใหม่สำหรับหุ่นยนต์

Share this:

About นักเขียนฝึกหัดหมายเลขเก้า

Related Articles

Check Also