OpenAI เปิดตัวโมเดล o3 และ o4-mini พร้อมความสามารถด้านการใช้เหตุผลขั้นสูง และใช้งานเครื่องมือได้อย่างอัตโนมัติ

OpenAI ประกาศเปิดตัวโมเดล o3 และ o4-mini ซึ่งเป็นโมเดล AI ล่าสุดในตระกูล o-series ที่ได้รับการพัฒนาให้มีความสามารถด้านการคิดวิเคราะห์และการใช้เหตุผลที่โดดเด่น พร้อมรองรับการใช้งานเครื่องมือหลากหลายรูปแบบ

โมเดลทั้งสองสามารถเข้าถึงและใช้เครื่องมือทุกประเภทใน ChatGPT ได้อย่างอัตโนมัติ ไม่ว่าจะเป็นการค้นหาข้อมูลบนเว็บ, การวิเคราะห์ไฟล์ที่อัปโหลด, การประมวลผลภาพ หรือแม้แต่การเขียนโค้ด Python เพื่อวิเคราะห์ข้อมูล ซึ่งถือเป็นครั้งแรกที่โมเดลใน o-series มีความสามารถด้านนี้ จุดเด่นอยู่ที่โมเดลจะวิเคราะห์ว่าเมื่อไหร่และอย่างไรที่ควรใช้เครื่องมือเหล่านี้ รวมถึงให้คำตอบที่ละเอียดยิ่งขึ้น ทั้งนี้คำตอบส่วนใหญ่จะได้ภายในเวลาประมาณ 1 นาที

สำหรับโมเดล OpenAI o3 นับว่าเป็นโมเดลที่มีประสิทธิภาพสูงสุดในด้านการใช้เหตุผล โดยทำลายสถิติในหลายเกณฑ์มาตรฐาน ทั้ง Codeforces, SWE-bench และ MMMU เหมาะสำหรับคำถามที่ซับซ้อนและต้องการการวิเคราะห์หลายแง่มุม โดยเฉพาะอย่างยิ่งในด้านการเขียนโค้ด, คณิตศาสตร์, วิทยาศาสตร์, และการรับรู้ภาพ จากการทดสอบโดยผู้เชี่ยวชาญภายนอกพบว่า o3 มีข้อผิดพลาดสำคัญน้อยกว่า OpenAI o1 ถึง 20% ในงานที่ยากและซับซ้อนในโลกจริง

ในขณะที่ OpenAI o4-mini เป็นโมเดลขนาดเล็กที่ได้รับการปรับแต่งให้ทำงานได้อย่างรวดเร็วและมีประสิทธิภาพสูงเมื่อเทียบกับขนาด เหมาะสำหรับการใช้งานที่ต้องการประมวลผลข้อมูลจำนวนมาก โดยมีความโดดเด่นในด้านคณิตศาสตร์, การเขียนโค้ด, และงานที่เกี่ยวกับภาพ นอกจากนี้ยังเป็นโมเดลที่มีประสิทธิภาพสูงสุดในการทดสอบ AIME 2024 และ 2025

ทั้งสองโมเดลนี้ได้พัฒนาโดยใช้เทคนิค reinforcement learning ในระดับขนาดใหญ่ ซึ่งยิ่งใช้ทรัพยากรคอมพิวเตอร์มากขึ้นก็ยิ่งให้ประสิทธิภาพที่ดีขึ้น ทั้งนี้ OpenAI ได้เพิ่มการฝึกฝนให้โมเดลรู้จักเลือกใช้เครื่องมือต่างๆ ผ่าน reinforcement learning ทำให้สามารถตัดสินใจได้ว่าเมื่อไหร่ควรใช้เครื่องมือใด โดยเฉพาะในสถานการณ์ที่เกี่ยวข้องกับการวิเคราะห์ภาพและการทำงานที่มีหลายขั้นตอน

ในด้านความปลอดภัย OpenAI ได้สร้างข้อมูลฝึกฝนด้านความปลอดภัยใหม่ทั้งหมด โดยเพิ่มข้อมูลเกี่ยวกับการปฏิเสธคำขอในด้านภัยคุกคามทางชีวภาพ (biorisk), การสร้างมัลแวร์, และการโจมตีระบบ ซึ่งทำให้โมเดล o3 และ o4-mini มีประสิทธิภาพสูงในการปฏิเสธคำขอที่ไม่เหมาะสม นอกจากนี้ยังได้พัฒนามาตรการป้องกันในระดับระบบเพื่อตรวจจับคำขอที่อันตรายในด้านต่างๆ อีกด้วย

ที่มา: https://openai.com/index/introducing-o3-and-o4-mini/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

Omnissa เปิดตัว Workspace ONE UEM 2604 บริหารจัดการ Windows Server ได้แล้ว เพิ่มความสามารถใหม่ๆ มากมาย

Omnissa ได้ออกมาเปิดตัว Release ใหม่ล่าสุด 2604 โดยถือเป็นหนึ่งในการอัปเดตครั้งใหญ่ที่สุด ด้วยความสามารถใหม่ๆ มากมาย ดังนี้