Alibaba เปิดตัว Marco-o1 ให้เหตุผลในขั้นสูงขึ้น

หลังจาก OpenAI ได้เปิดตัวโมเดล o1 ในช่วงกันยายนที่เคลมว่ามีประสิทธิภาพระดับนักศึกษาปริญญาเอก ล่าสุด นักวิจัยจาก Alibaba ได้เปิดตัวโมเดล Marco-o1 ที่เผยว่าได้เพิ่มขีดความสามารถในการให้เหตุผล และสามารถจัดการกับปัญหาในโลกความเป็นจริงที่ซับซ้อนได้รวดเร็วยิ่งขึ้น

หลังจาก OpenAI ได้เปิดตัว OpenAI o1 ที่ทำให้เกิดความสนใจในการศึกษาโมเดลที่เป็น Large Reasoning Model (LRM) มากขึ้น ทีมนักวิจัยจาก Alibaba จึงได้ศึกษาต่อยอดและได้เปิดตัวโมเดล Marco-o1 ที่สามารถจัดการกับปัญหาที่ไม่ได้มีคำตอบล่วงหน้า (Open-Ended Resolution) ได้ด้วย

Marco-o1

โดยนักวิจัย Alibaba ชี้ว่า Marco-o1 นี้มีขีดความสามารถที่ไม่ได้แค่โฟกัสในการให้คำตอบตามมาตรฐานทั่วไป เช่น การคำนวณทางคณิตศาสตร์ ฟิสิกส์ หรือเขียนโปรแกรม แต่ยังสามารถให้คำตอบกับคำถามปลายเปิด หรืองานที่มีการให้เหตุผลในขั้นที่สูงขึ้น เช่น การแปลภาษาที่จะต้องเน้นอารมณ์ได้ดีขึ้น

ตัวอย่างการแปลที่มีสำนวนการแสดงอารมณ์ได้มากขึ้น
Credit : Marco-o1

สำหรับ Marco-o1 ณ ตอนนี้นี้เป็นเวอร์ชัน Fine-tuned จาก Qwen2-7B-Instruct ของทาง Alibaba ที่เสริมด้วยเทคนิคต่าง ๆ เช่น การทำ Chain-of-Thought Fine-Tuning, Monte Carlo Tree Search และกลยุทธ์ในการให้เหตุผลต่าง ๆ ซึ่งผลลัพธ์การทดสอบแสดงให้เห็นว่าโมเดลมีขีดความสามารถในการให้เหตุผลขั้นสูงที่ดีขึ้นกว่าเดิม

Credit : Marco-o1

สำหรับผู้ที่สนใจรายละเอียดของ Marco-o1 ของนักวิจัยจาก Alibaba สามารถอ่านเพิ่มเติมได้ที่งานตีพิมพ์ หรือที่ GitHub 

ที่มา: https://venturebeat.com/ai/alibaba-researchers-unveil-marco-o1-an-llm-with-advanced-reasoning-capabilities/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ