Alibaba เปิดตัว Marco-o1 ให้เหตุผลในขั้นสูงขึ้น

หลังจาก OpenAI ได้เปิดตัวโมเดล o1 ในช่วงกันยายนที่เคลมว่ามีประสิทธิภาพระดับนักศึกษาปริญญาเอก ล่าสุด นักวิจัยจาก Alibaba ได้เปิดตัวโมเดล Marco-o1 ที่เผยว่าได้เพิ่มขีดความสามารถในการให้เหตุผล และสามารถจัดการกับปัญหาในโลกความเป็นจริงที่ซับซ้อนได้รวดเร็วยิ่งขึ้น

หลังจาก OpenAI ได้เปิดตัว OpenAI o1 ที่ทำให้เกิดความสนใจในการศึกษาโมเดลที่เป็น Large Reasoning Model (LRM) มากขึ้น ทีมนักวิจัยจาก Alibaba จึงได้ศึกษาต่อยอดและได้เปิดตัวโมเดล Marco-o1 ที่สามารถจัดการกับปัญหาที่ไม่ได้มีคำตอบล่วงหน้า (Open-Ended Resolution) ได้ด้วย

Marco-o1

โดยนักวิจัย Alibaba ชี้ว่า Marco-o1 นี้มีขีดความสามารถที่ไม่ได้แค่โฟกัสในการให้คำตอบตามมาตรฐานทั่วไป เช่น การคำนวณทางคณิตศาสตร์ ฟิสิกส์ หรือเขียนโปรแกรม แต่ยังสามารถให้คำตอบกับคำถามปลายเปิด หรืองานที่มีการให้เหตุผลในขั้นที่สูงขึ้น เช่น การแปลภาษาที่จะต้องเน้นอารมณ์ได้ดีขึ้น

ตัวอย่างการแปลที่มีสำนวนการแสดงอารมณ์ได้มากขึ้น
Credit : Marco-o1

สำหรับ Marco-o1 ณ ตอนนี้นี้เป็นเวอร์ชัน Fine-tuned จาก Qwen2-7B-Instruct ของทาง Alibaba ที่เสริมด้วยเทคนิคต่าง ๆ เช่น การทำ Chain-of-Thought Fine-Tuning, Monte Carlo Tree Search และกลยุทธ์ในการให้เหตุผลต่าง ๆ ซึ่งผลลัพธ์การทดสอบแสดงให้เห็นว่าโมเดลมีขีดความสามารถในการให้เหตุผลขั้นสูงที่ดีขึ้นกว่าเดิม

Credit : Marco-o1

สำหรับผู้ที่สนใจรายละเอียดของ Marco-o1 ของนักวิจัยจาก Alibaba สามารถอ่านเพิ่มเติมได้ที่งานตีพิมพ์ หรือที่ GitHub 

ที่มา: https://venturebeat.com/ai/alibaba-researchers-unveil-marco-o1-an-llm-with-advanced-reasoning-capabilities/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Ericsson เปิดตัวโซลูชัน AI in RAN ยกระดับ 5G ไปอีกขั้นด้วยโครงข่ายที่ฝัง AI อยู่ภายใน

Ericsson เปิดตัว AI in RAN ซอฟต์แวร์แบบ Subscription ล่าสุดที่ฝัง AI ลงในแพลตฟอร์ม Radio Access Network (RAN) โดยตรง …