OpenAI เปิดตัวโมเดล o3 ทำลายสถิติการทดสอบด้านการใช้เหตุผล

December 21, 2024 AI, Cloud and Systems, OpenAI, Products

OpenAI ประกาศรายละเอียดโมเดล AI ตัวใหม่ชื่อ o3 ที่มีความสามารถด้านการใช้เหตุผลสูง โดยทำลายสถิติการทดสอบในหลายด้าน รวมถึงการทดสอบ ARC-AGI-1 ที่วัดความสามารถในการปรับตัวทำงานที่ไม่เคยถูกฝึกฝนมาก่อน

โมเดล o3 สร้างความน่าประหลาดใจด้วยผลการทดสอบ ARC-AGI-1 ที่ได้คะแนน 75.7% และเพิ่มขึ้นเป็น 87.5% เมื่อใช้ทรัพยากรการประมวลผลเพิ่มขึ้น ซึ่งสูงกว่า GPT-3 และ GPT-4o ที่ทำได้เพียง 0% และ 5% ตามลำดับ François Chollet ผู้พัฒนาการทดสอบนี้กล่าวว่า แม้ผลการทดสอบจะน่าประทับใจ แต่ยังไม่ถือว่า o3 เป็น AGI (Artificial General Intelligence) เพราะยังมีข้อจำกัดในการทำงานบางด้านที่มนุษย์ทำได้ดีกว่า

นอกจากนี้ o3 ยังทำลายสถิติในการทดสอบ Frontier Math ซึ่งเป็นชุดโจทย์คณิตศาสตร์ขั้นสูงที่สร้างขึ้นโดยนักคณิตศาสตร์กว่า 60 คน โดยสามารถแก้โจทย์ได้ถึง 25.2% เทียบกับสถิติเดิมที่ทำได้เพียง 2% ในด้านการเขียนโปรแกรม o3 ทำคะแนนในการทดสอบ SWE-Bench Verified สูงกว่ารุ่นก่อนหน้า o1 ถึง 22.8% โดยการทดสอบนี้วัดความสามารถในการค้นหาและแก้ไขข้อผิดพลาดในโค้ดจากคำอธิบายภาษาธรรมชาติ

OpenAI เปิดเผยว่า o3 มีให้เลือก 2 เวอร์ชัน ได้แก่ o3 รุ่นเต็มประสิทธิภาพ และ o3-mini ที่เน้นการตอบสนองเร็วและใช้ทรัพยากรน้อยกว่า เช่นเดียวกับรุ่น o1 ที่มีเวอร์ชันย่อยเช่นกัน ในช่วงแรก บริษัทจะจำกัดการเข้าถึงเฉพาะนักวิจัยด้านความปลอดภัย AI และความปลอดภัยไซเบอร์ เพื่อรวบรวมข้อเสนอแนะในการปรับปรุงความปลอดภัยก่อนเปิดให้ใช้งานในวงกว้าง

ในด้านความปลอดภัย OpenAI ได้พัฒนาเทคนิคใหม่ชื่อ deliberative alignment สำหรับป้องกันการสร้างเนื้อหาที่เป็นอันตราย โดยเทคนิคนี้ช่วยให้นักวิจัยสามารถกำหนดแนวทางด้านความปลอดภัยที่เขียนโดยมนุษย์เข้าไปในชุดข้อมูลฝึกฝน ทำให้โมเดลเรียนรู้และปฏิบัติตามแนวทางเหล่านั้นได้อย่างมีประสิทธิภาพ การพัฒนานี้เป็นส่วนหนึ่งของความพยายามในการสร้าง AI ที่ปลอดภัยและมีความรับผิดชอบ

ที่มา: https://siliconangle.com/2024/12/20/openai-details-o3-reasoning-model-record-breaking-benchmark-scores/

[Video Webinar] AskMe AI Gateway – รวม AI ชั้นนำไว้ในแพลตฟอร์มเดียว พร้อมความปลอดภัยที่องค์กรไว้วางใจ

สำหรับผู้ที่ไม่ได้เข้าฟังการบรรยาย AskMe AI Gateway Webinar เพื่อทำความรู้จักกับแพลตฟอร์ม AI เฉพาะสำหรับองค์กรที่ช่วยให้พนักงานเข้าถึง AI ชั้นนำได้อย่างปลอดภัย พร้อมควบคุมสิทธิ์ ข้อมูล ค่าใช้จ่าย และตรวจสอบได้ครบในที่เดียว ที่เพิ่งจัดไปเมื่อสัปดาห์ที่ผ่านมา …

Dell Technologies ปรับโฉมใหม่ Dell Pro รุกตลาด AI กรุยทางสู่อนาคตการใช้งานระดับองค์กร

เทรนด์ของ AI PCs กำลังมีบทบาทมากขึ้นในปัจจุบัน ซึ่ง IDC คาดการณ์ว่าความต้องการของ AI PCs จะมีแต่ถูกเร่งขึ้นเรื่อยๆ เพราะ AI ได้แทรกเข้าไปในแทบทุกส่วนของการทำงาน ไม่ว่าจะเป็นการประชุม การสร้างคอนเท้นต์ …

TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

OpenAI เปิดตัวโมเดล o3 ทำลายสถิติการทดสอบด้านการใช้เหตุผล

About เด็กฝึกงาน TechTalkThai หมายเลข 1

Related Articles

Check Also

[Video Webinar] AskMe AI Gateway – รวม AI ชั้นนำไว้ในแพลตฟอร์มเดียว พร้อมความปลอดภัยที่องค์กรไว้วางใจ

Dell Technologies ปรับโฉมใหม่ Dell Pro รุกตลาด AI กรุยทางสู่อนาคตการใช้งานระดับองค์กร

OpenAI เปิดตัวโมเดล o3 ทำลายสถิติการทดสอบด้านการใช้เหตุผล

Share this:

About เด็กฝึกงาน TechTalkThai หมายเลข 1

Related Articles

Check Also