หลังจาก OpenAI ได้เปิดตัวโมเดล o1 ในช่วงกันยายนที่เคลมว่ามีประสิทธิภาพระดับนักศึกษาปริญญาเอก ล่าสุด นักวิจัยจาก Alibaba ได้เปิดตัวโมเดล Marco-o1 ที่เผยว่าได้เพิ่มขีดความสามารถในการให้เหตุผล และสามารถจัดการกับปัญหาในโลกความเป็นจริงที่ซับซ้อนได้รวดเร็วยิ่งขึ้น
หลังจาก OpenAI ได้เปิดตัว OpenAI o1 ที่ทำให้เกิดความสนใจในการศึกษาโมเดลที่เป็น Large Reasoning Model (LRM) มากขึ้น ทีมนักวิจัยจาก Alibaba จึงได้ศึกษาต่อยอดและได้เปิดตัวโมเดล Marco-o1 ที่สามารถจัดการกับปัญหาที่ไม่ได้มีคำตอบล่วงหน้า (Open-Ended Resolution) ได้ด้วย
โดยนักวิจัย Alibaba ชี้ว่า Marco-o1 นี้มีขีดความสามารถที่ไม่ได้แค่โฟกัสในการให้คำตอบตามมาตรฐานทั่วไป เช่น การคำนวณทางคณิตศาสตร์ ฟิสิกส์ หรือเขียนโปรแกรม แต่ยังสามารถให้คำตอบกับคำถามปลายเปิด หรืองานที่มีการให้เหตุผลในขั้นที่สูงขึ้น เช่น การแปลภาษาที่จะต้องเน้นอารมณ์ได้ดีขึ้น
สำหรับ Marco-o1 ณ ตอนนี้นี้เป็นเวอร์ชัน Fine-tuned จาก Qwen2-7B-Instruct ของทาง Alibaba ที่เสริมด้วยเทคนิคต่าง ๆ เช่น การทำ Chain-of-Thought Fine-Tuning, Monte Carlo Tree Search และกลยุทธ์ในการให้เหตุผลต่าง ๆ ซึ่งผลลัพธ์การทดสอบแสดงให้เห็นว่าโมเดลมีขีดความสามารถในการให้เหตุผลขั้นสูงที่ดีขึ้นกว่าเดิม
สำหรับผู้ที่สนใจรายละเอียดของ Marco-o1 ของนักวิจัยจาก Alibaba สามารถอ่านเพิ่มเติมได้ที่งานตีพิมพ์ หรือที่ GitHub