Google เตรียมทีมสร้าง AI สำหรับ World Model กรุยทางสู่ AGI

กว่าจะไปถึง Artificial General Intelligence(AGI) ที่จะทำให้ AI สามารถทำงานของมนุษย์ได้นั้นยังต้องมีการเดินทางอีกมาก ซึ่งทาง Google DeepMind ก็ได้ Tim Brooks มาเป็นผู้กุมบังเหียนทีมใหม่จาก OpenAI ที่เป็นหนึ่งในผู้สร้าง Sora หรือคอนเท้นต์ที่ AI สามารถสร้างวีดีโอขึ้นได้ แต่การสร้างวีดีโอนั้นเป็นเพียงแค่ปลายยอดของสิ่งที่จะเกิดขึ้นได้ต่อไปเท่านั้น

credit : Developers Digest

World models หรือ World Simulator เป็นอะไรที่ลึกกว่านั้น โดยมีแรงบันดาลใจมาจากสิ่งที่สมองมนุษย์ทำความเข้าใจกับโลกผ่านการรับรู้ต่างๆ และสะท้อนสู่สิ่งที่จะปฏิบัติออกไปได้ด้วย ยกตัวอย่างในงานวิจัยหนึ่งที่เห็นภาพได้ชัดคือการที่ผู้เล่นเบสบอลรู้จังหวะในการตีลูกบอลอย่างไรให้โดน ซึ่งใช้เวลาสั้นมาก โดยเบื้องหลังคือสัญชาตญาณที่รู้ว่าบอลจะไปทางไหน มันประกอบไปด้วยการเคลื่อนไหวกล้ามเนื้อที่จะหวดให้เหมาะเจาะตรงเวลาและพิกัดของแนวเส้นที่ตี โดยไม่ต้องรอครุ่นคิดเพื่อวางแผน ซึ่งจิตใต้สำนึกนี้แหละคือเป้าหมายของ World Model ที่ถูกเชื่อว่าเป็นส่วนหนึ่งของความชาญฉลาดที่มนุษย์มี แม้ว่า AI จะสร้างวีดีโอที่มันได้รับข้อมูลเข้าไปได้ แต่มันต่างกับความเข้าใจที่จะตอบคำถามว่าทำไมต้องตอบสนองแบบนั้น เฉกเช่นเดียวกับการที่ Language Model ไม่ได้เข้าใจคอนเซปต์ของคำหรือกลุ่มคำเหล่านั้นจริงๆ

การที่จะได้ Insight ที่ว่าตัว World Model ต้องได้รับข้อมูลหลายประเภททั้ง รูปภาพ เสียง วีดีโอ และข้อความ เพื่อประมวลผลร่วมกันและความสามารถในการเข้าใจลำดับของผลการกระทำ ซึ่งการสร้างวีดีโอโดย AI เป็นเพียงแค่ยอดภูเขาของศาสตร์นี้เท่านั้น โดยนักวิจัยหลายฝ่ายชี้ว่าโมเดลเหล่านี้สามารถใช้เพื่อการทำนายที่ซับซ้อนและวางแผนในระดับดิจิทัลหรือโลกกายภาพได้ เช่น โจทย์ที่จะให้จักรกลเข้าใจว่าอะไรคือการเปลี่ยนแปลงจากห้องสกปรกเป็นห้องสะอาด ซึ่งแน่นอนว่ามันไม่ได้กระทำกิจกรรมไปเรื่อยๆ แต่เข้าใจลึกซึ้งว่าจะทำอย่างไรห้องถึงจะสะอาด โดยการทำจะเข้าใจโลกจักรกลต้องรู้จำ มีสัญชาติญาณ และมีความเข้าใจพื้นฐาน เพื่อให้วางแผนได้ในระดับมนุษย์

ในแผนของ Google ทีมโมเดลใหม่จะทำงานร่วมกับงานที่อยู่บน Gemini, Veo (โมเดลสร้างวีดีโอของ Google) และ Genie (World Model ที่เพิ่งแสดงผลงานจำลองเกมและสภาพแวดล้อม 3 มิติในระดับเรียลไทม์) โดย Google ไม่ใช่ผู้เล่นรายเดียวที่สนใจใน World Models แต่ยังมีบริษัทอื่นอีกหลายแห่ง โดยพวกเขาเชื่อว่าวันหนึ่ง World Models จะสามารถสร้างเกม หนัง และการจำลองสภาพแวดล้อมสมจริงเพื่อสอนหุ่นยนต์ได้ อย่างไรก็ตามปัญหาที่น่าสนใจคือเรื่องข้อมูลที่บริษัทต่างๆอาจมีอยู่อย่างจำกัดแต่อย่างลืมว่า Google มี YouTube อยู่แล้วขึ้นอยู่กับว่าจะมีจรรยาบรรณและแนวทางอย่างไรก็ไม่มีใครรู้ได้ แน่นอนว่ายังมีเรื่องของพลังประมวลผลที่ต้องลงทุนด้วย

ที่มา : https://techcrunch.com/2025/01/06/google-is-forming-a-new-team-to-build-ai-that-can-simulate-the-physical-world/

About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

Tines ระดมทุน 125 ล้านดอลลาร์ ดันแพลตฟอร์ม AI สร้างเวิร์กโฟลว์อัตโนมัติ

Tines Security Service สตาร์ทอัพเจ้าของแพลตฟอร์มสำหรับทำงานหลายขั้นตอน เช่น การตั้งค่าคลาวด์อินสแตนซ์ โดยอัตโนมัติ ประกาศระดมทุนได้ 125 ล้านดอลลาร์ในรอบ Series C ที่นำโดย Goldman Sachs …

Google Chrome Enhanced Protection ปกป้องผู้ใช้จากภัยคุกคามออนไลน์ได้กว่า 1 พันล้านรายแล้ว

Google ฉลองก้าวสำคัญ โดยประกาศว่าโหมด Enhanced Protection ใน Chrome ซึ่งใช้ปัญญาประดิษฐ์ (AI) และแมชชีนเลิร์นนิงเพื่อตรวจจับและบล็อกภัยคุกคามออนไลน์แบบเรียลไทม์ ขณะนี้สามารถปกป้องผู้ใช้ได้กว่า 1 พันล้านรายจากฟิชชิงและการหลอกลวงออนไลน์แล้ว