Alibaba เปิดตัว Marco-o1 ให้เหตุผลในขั้นสูงขึ้น

หลังจาก OpenAI ได้เปิดตัวโมเดล o1 ในช่วงกันยายนที่เคลมว่ามีประสิทธิภาพระดับนักศึกษาปริญญาเอก ล่าสุด นักวิจัยจาก Alibaba ได้เปิดตัวโมเดล Marco-o1 ที่เผยว่าได้เพิ่มขีดความสามารถในการให้เหตุผล และสามารถจัดการกับปัญหาในโลกความเป็นจริงที่ซับซ้อนได้รวดเร็วยิ่งขึ้น

หลังจาก OpenAI ได้เปิดตัว OpenAI o1 ที่ทำให้เกิดความสนใจในการศึกษาโมเดลที่เป็น Large Reasoning Model (LRM) มากขึ้น ทีมนักวิจัยจาก Alibaba จึงได้ศึกษาต่อยอดและได้เปิดตัวโมเดล Marco-o1 ที่สามารถจัดการกับปัญหาที่ไม่ได้มีคำตอบล่วงหน้า (Open-Ended Resolution) ได้ด้วย

Marco-o1

โดยนักวิจัย Alibaba ชี้ว่า Marco-o1 นี้มีขีดความสามารถที่ไม่ได้แค่โฟกัสในการให้คำตอบตามมาตรฐานทั่วไป เช่น การคำนวณทางคณิตศาสตร์ ฟิสิกส์ หรือเขียนโปรแกรม แต่ยังสามารถให้คำตอบกับคำถามปลายเปิด หรืองานที่มีการให้เหตุผลในขั้นที่สูงขึ้น เช่น การแปลภาษาที่จะต้องเน้นอารมณ์ได้ดีขึ้น

ตัวอย่างการแปลที่มีสำนวนการแสดงอารมณ์ได้มากขึ้น
Credit : Marco-o1

สำหรับ Marco-o1 ณ ตอนนี้นี้เป็นเวอร์ชัน Fine-tuned จาก Qwen2-7B-Instruct ของทาง Alibaba ที่เสริมด้วยเทคนิคต่าง ๆ เช่น การทำ Chain-of-Thought Fine-Tuning, Monte Carlo Tree Search และกลยุทธ์ในการให้เหตุผลต่าง ๆ ซึ่งผลลัพธ์การทดสอบแสดงให้เห็นว่าโมเดลมีขีดความสามารถในการให้เหตุผลขั้นสูงที่ดีขึ้นกว่าเดิม

Credit : Marco-o1

สำหรับผู้ที่สนใจรายละเอียดของ Marco-o1 ของนักวิจัยจาก Alibaba สามารถอ่านเพิ่มเติมได้ที่งานตีพิมพ์ หรือที่ GitHub 

ที่มา: https://venturebeat.com/ai/alibaba-researchers-unveil-marco-o1-an-llm-with-advanced-reasoning-capabilities/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

AWS Management Console สนับสนุน Sign-In พร้อมกันหลายบัญชีได้แล้ว

ล่าสุด AWS ผู้ให้บริการ Cloud ยักษ์ใหญ่ได้ประกาศสนับสนุนการใช้งาน Multi-Session หรือการเข้าถึง AWS Management Console ด้วยบัญชี AWS ได้พร้อมกันหลายบัญชี โดยผู้ใช้งานจะสามารถ Sign-In …

Merit Systems ระดมทุน 10 ล้านดอลลาร์ สร้างโมเดลเศรษฐศาสตร์ “ทุนนิยมโอเพนซอร์ส”

สตาร์ทอัพ Merit Systems ได้รับความสนใจอย่างมากหลังระดมทุนได้ถึง 10 ล้านเหรียญสหรัฐ ในรอบที่นำโดยนักลงทุนชั้นนำอย่าง a16z Crypto และ Blockchain Capital เพื่อสร้าง “ทุนนิยมโอเพนซอร์ส” โมเดลเศรษฐศาสตร์ใหม่ที่จะใหผลตอบแทนอย่างยุติธรรมแก่ผู้มีส่วนร่วมในโครงการซอฟต์แวร์โอเพนซอร์ส …