Anthropic เปิดตัว Claude Opus 4.1 เพิ่มประสิทธิภาพด้าน Software Engineering

Claude Opus 4.1 โมเดล AI รุ่นล่าสุดจาก Anthropic ปรับปรุงความแม่นยำในการเขียนโค้ดสูงถึง 74.5% พร้อมเพิ่มความสามารถด้าน agentic tasks และการวิเคราะห์ข้อมูลเชิงลึก

Credit: Anthropic

Anthropic ประกาศเปิดตัว Claude Opus 4.1 เวอร์ชันอัปเกรดจาก Claude Opus 4 ที่มุ่งเน้นการพัฒนาประสิทธิภาพในด้าน agentic tasks, real-world coding และความสามารถในการให้เหตุผล โดยจุดเด่นที่สำคัญคือการปรับปรุงความแม่นยำด้าน software engineering จากเดิม 72.5% ใน Claude Opus 4 มาเป็น 74.5% ตามผลทดสอบบน SWE-bench Verified ซึ่งสูงกว่า Claude Sonnet 3.7 ที่ได้คะแนน 62.3% อย่างเห็นได้ชัด นอกจากนี้โมเดลยังพัฒนาทักษะการวิจัยเชิงลึกและการวิเคราะห์ข้อมูล โดยเฉพาะความสามารถในการติดตามรายละเอียดและการค้นหาแบบ agentic search

จากการทดสอบโดยองค์กรต่างๆ พบว่า Claude Opus 4.1 แสดงผลงานที่โดดเด่นในหลายด้าน GitHub รายงานว่าโมเดลมีการปรับปรุงในเกือบทุกความสามารถเมื่อเทียบกับ Opus 4 โดยเฉพาะประสิทธิภาพในการ refactor โค้ดหลายไฟล์พร้อมกัน Rakuten Group พบว่า Opus 4.1 มีความเชี่ยวชาญในการระบุจุดที่ต้องแก้ไขใน codebase ขนาดใหญ่ได้อย่างแม่นยำ โดยไม่ทำการปรับเปลี่ยนที่ไม่จำเป็นหรือสร้าง bug ขึ้นมาใหม่ ซึ่งทีมพัฒนาชื่นชอบความแม่นยำนี้สำหรับงาน debugging ประจำวัน ส่วน Windsurf รายงานว่า Opus 4.1 มีประสิทธิภาพดีขึ้นหนึ่ง standard deviation จาก Opus 4 บน junior developer benchmark ของบริษัท

Credit: Anthropic

Claude Opus 4.1 พร้อมให้บริการแล้วสำหรับผู้ใช้งาน Claude แบบเสียค่าบริการและผ่าน Claude Code รวมถึงสามารถเข้าถึงผ่าน API ของ Anthropic, Amazon Bedrock และ Google Cloud’s Vertex AI โดยมีราคาเท่ากับ Opus 4 นักพัฒนาสามารถใช้งานผ่าน API ด้วยโมเดล claude-opus-4-1-20250805 นอกจากนี้ Anthropic ยังเผยว่าบริษัทมีแผนที่จะปล่อยการปรับปรุงที่สำคัญให้กับโมเดลในอีกไม่กี่สัปดาห์ข้างหน้า

ที่มา: https://9to5mac.com/2025/08/05/anthropic-claude-opus-4-1/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ