Tag Archives: swe-bench

OpenAI เปิดตัว GPT-5.4 โมเดล AI สำหรับงานระดับมืออาชีพพร้อมความสามารถควบคุมคอมพิวเตอร์

OpenAI เปิดตัว GPT-5.4 โมเดล AI รุ่นใหม่ล่าสุดที่รวมความสามารถด้าน Reasoning, Coding และ Computer Use เข้าด้วยกัน พร้อมเปิดให้บริการแล้วทั้งบน ChatGPT, API และ Codex

Read More »

OpenAI เปิดตัว GPT-5.3-Codex โมเดล Coding Agent ใหม่ เร็วขึ้น 25% พร้อมทำงานระดับมืออาชีพ

OpenAI เปิดตัว GPT-5.3-Codex โมเดล AI สำหรับ coding agent รุ่นใหม่ล่าสุดที่รวมความสามารถด้าน coding จาก GPT-5.2-Codex และด้าน reasoning จาก GPT-5.2 เข้าไว้ด้วยกัน โดยทำงานเร็วขึ้น 25% และเป็นโมเดลแรกที่มีส่วนช่วยในการพัฒนาตัวเองระหว่างกระบวนการ training

Read More »

OpenAI เปิดตัว GPT-5.2-Codex โมเดล AI สำหรับงาน Coding และ Cybersecurity

OpenAI เปิดตัว GPT-5.2-Codex โมเดล AI รุ่นใหม่ล่าสุดสำหรับงาน Agentic Coding พร้อมความสามารถด้าน Cybersecurity ที่ปรับปรุงขึ้นอย่างมีนัยสำคัญ

Read More »

OpenAI เปิดตัว GPT-5.2 โมเดล AI ความสามารถด้านคณิตศาสตร์สูงเป็นประวัติการณ์

OpenAI เปิดตัว GPT-5.2 โมเดล AI รุ่นใหม่ล่าสุดที่มีความสามารถด้านคณิตศาสตร์และการเขียนโค้ดสูงที่สุดในอุตสาหกรรม พร้อมเปิดให้บริการแล้วผ่าน ChatGPT และ API

Read More »

Mistral AI เปิดตัว Devstral 2 โมเดล Open-Weights สำหรับ Coding ท้าชน Claude และ GPT

Mistral AI เปิดตัว Devstral 2 โมเดล AI ขนาด 123 พันล้าน parameters สำหรับงาน coding ขั้นสูง พร้อมราคาถูกกว่าคู่แข่งถึง 85%

Read More »

Anthropic เปิดตัว Claude Opus 4.5 โมเดล AI เรือธงรุ่นใหม่ เก่งงาน Agent และเขียนโค้ดดีขึ้น

Anthropic เปิดตัว Claude Opus 4.5 Large Language Model เรือธงรุ่นใหม่ที่บริษัทระบุว่าเป็นโมเดลที่มีความสามารถสูงสุดและปลอดภัยที่สุดเท่าที่เคยพัฒนามา โดยเฉพาะความสามารถด้าน AI Agent ที่ดีกว่าคู่แข่งอย่างชัดเจน

Read More »

Claude เปิดตัว Haiku 4.5 โมเดล AI ขนาดเล็กประสิทธิภาพใกล้เคียงรุ่นใหญ่ด้วยความเร็วที่สูงกว่า

Anthropic เปิดตัว Claude Haiku 4.5 โมเดล AI ขนาดเล็กรุ่นใหม่ที่มีประสิทธิภาพด้านการเขียนโค้ดใกล้เคียงกับ Claude Sonnet 4 แต่ใช้ต้นทุนเพียง 1 ใน 3 และทำงานเร็วกว่า 2 เท่า

Read More »

Anthropic เปิดตัว Claude Sonnet 4.5

Anthropic ประกาศเปิดตัว Claude Sonnet 4.5 โมเดล AI ใหม่ล่าสุดที่มีความสามารถโดดเด่นในการเขียนโค้ด สร้าง Agent ที่ซับซ้อน และใช้งานคอมพิวเตอร์ได้ดีที่สุดในขณะนี้ พร้อมเปิดให้นักพัฒนาใช้งานผ่าน API ทันทีในราคาเดิม

Read More »

OpenAI เปิดตัว GPT-5 โมเดล AI รุ่นใหม่พร้อมความแม่นยำสูงและพลังการเขียนโค้ดที่เหนือกว่า

OpenAI ประกาศเปิดตัว GPT-5 โมเดล AI รุ่นล่าสุดที่มีประสิทธิภาพเหนือกว่ารุ่นก่อนหน้าในทุกด้าน พร้อมระบบ hybrid ที่สามารถสลับระหว่างโหมดตอบคำถามทั่วไปและโหมดคิดวิเคราะห์เชิงลึกได้อัตโนมัติ

Read More »

Anthropic เปิดตัว Claude Opus 4.1 เพิ่มประสิทธิภาพด้าน Software Engineering

Claude Opus 4.1 โมเดล AI รุ่นล่าสุดจาก Anthropic ปรับปรุงความแม่นยำในการเขียนโค้ดสูงถึง 74.5% พร้อมเพิ่มความสามารถด้าน agentic tasks และการวิเคราะห์ข้อมูลเชิงลึก

Read More »

Anthropic เปิดตัว Claude 4 โมเดล AI ใหม่เน้นความสามารถด้านการเขียนโค้ดและ Agent ขั้นสูง

Anthropic ประกาศเปิดตัว Claude Opus 4 และ Claude Sonnet 4 โมเดล AI รุ่นใหม่ที่เน้นความสามารถด้านการเขียนโค้ดและการทำงานแบบ Agent รวมถึงการเปิดตัว Claude Code แบบ General Availability

Read More »

Anthropic เปิดตัว Claude 3.7 Sonnet มาพร้อมระบบการคิดวิเคราะห์แบบ Extended Thinking Mode

Anthropic ประกาศเปิดตัว Claude 3.7 Sonnet โมเดล AI ที่ฉลาดที่สุดถึงปัจจุบัน และเป็นโมเดลแรกที่มีระบบ Hybrid Reasoning ที่สามารถคิดวิเคราะห์แบบขั้นตอนที่มองเห็นได้ พร้อมเปิดตัว Claude Code เครื่องมือสำหรับการเขียนโค้ดแบบ Agentic

Read More »

OpenAI เปิดตัวโมเดล o3 ทำลายสถิติการทดสอบด้านการใช้เหตุผล

OpenAI ประกาศรายละเอียดโมเดล AI ตัวใหม่ชื่อ o3 ที่มีความสามารถด้านการใช้เหตุผลสูง โดยทำลายสถิติการทดสอบในหลายด้าน รวมถึงการทดสอบ ARC-AGI-1 ที่วัดความสามารถในการปรับตัวทำงานที่ไม่เคยถูกฝึกฝนมาก่อน

Read More »