Anthropic เปิดตัว Claude Sonnet 4.5

Anthropic ประกาศเปิดตัว Claude Sonnet 4.5 โมเดล AI ใหม่ล่าสุดที่มีความสามารถโดดเด่นในการเขียนโค้ด สร้าง Agent ที่ซับซ้อน และใช้งานคอมพิวเตอร์ได้ดีที่สุดในขณะนี้ พร้อมเปิดให้นักพัฒนาใช้งานผ่าน API ทันทีในราคาเดิม

Credit: Anthropic

Claude Sonnet 4.5 เป็นโมเดลที่ทำคะแนนสูงสุดบน SWE-bench Verified ซึ่งเป็นการทดสอบความสามารถในการเขียนโค้ดซอฟต์แวร์จริง โดยสามารถรักษาสมาธิในการทำงานที่ซับซ้อนหลายขั้นตอนได้นานกว่า 30 ชั่วโมง บนการทดสอบ OSWorld ที่วัดความสามารถในการใช้คอมพิวเตอร์จริง Sonnet 4.5 ทำคะแนนได้ 61.4% เพิ่มขึ้นจาก 42.2% ของ Sonnet 4 เมื่อ 4 เดือนก่อน นอกจากนี้ยังมีการปรับปรุงความสามารถด้านการใช้เหตุผลและคณิตศาสตร์อย่างมีนัยสำคัญ

Anthropic ได้อัปเดตผลิตภัณฑ์หลายรายการควบคู่กับการเปิดตัวโมเดลใหม่นี้ Claude Code ได้รับฟีเจอร์ checkpoint ที่ช่วยบันทึกความคืบหน้าและย้อนกลับได้ พร้อมอินเตอร์เฟซ terminal ใหม่และ extension สำหรับ VS Code ส่วน Claude API ได้ฟีเจอร์แก้ไข context และเครื่องมือ memory ที่ช่วยให้ agent ทำงานได้นานขึ้น ในแอปพลิเคชัน Claude สามารถรันโค้ดและสร้างไฟล์ต่างๆ เช่น spreadsheet, slide และ document ได้โดยตรงในการสนทนา รวมถึง Claude for Chrome extension สำหรับสมาชิก Max

ที่สำคัญคือ Anthropic ได้เปิดตัว Claude Agent SDK ซึ่งเป็นโครงสร้างพื้นฐานเดียวกับที่ใช้พัฒนา Claude Code ให้นักพัฒนาสามารถนำไปสร้าง agent ของตนเองได้ SDK นี้รวบรวมประสบการณ์กว่า 6 เดือนในการแก้ปัญหาที่ซับซ้อน เช่น การจัดการ memory สำหรับงานระยะยาว ระบบ permission ที่สมดุลระหว่างความอิสระกับการควบคุม และการประสานงานระหว่าง subagent หลายตัว

Claude Sonnet 4.5 ยังเป็นโมเดลที่มีการจัดตำแหน่งดีที่สุดของ Anthropic โดยลดพฤติกรรมที่น่ากังวลหลายอย่าง เช่น การเอาใจ การหลอกลวง การแสวงหาอำนาจ และการส่งเสริมความคิดที่ผิดจากความเป็นจริง สำหรับความสามารถ agentic และการใช้คอมพิวเตอร์ ยังมีความก้าวหน้าในการป้องกันการโจมตีแบบ prompt injection ซึ่งเป็นความเสี่ยงสำคัญสำหรับผู้ใช้งาน โมเดลนี้ถูกเผยแพร่ภายใต้มาตรการป้องกัน AI Safety Level 3 (ASL-3) ตามกรอบการทำงานที่จับคู่ความสามารถของโมเดลกับมาตรการป้องกันที่เหมาะสม

Credit: Anthropic

ลูกค้าที่ใช้งานเบื้องต้นต่างก็ให้ผลตอบรับเป็นบวก Cursor รายงานว่าเห็นประสิทธิภาพการเขียนโค้ดระดับ state-of-the-art พร้อมการปรับปรุงที่สำคัญในงานระยะยาว GitHub Copilot พบการปรับปรุงในการใช้เหตุผลหลายขั้นตอนและความเข้าใจโค้ด Codeium รายงานว่าอัตราข้อผิดพลาดลดลงจาก 9% บน Sonnet 4 เหลือ 0% บน benchmark การแก้ไขโค้ดภายใน ขณะที่ Hai รายงานว่า Sonnet 4.5 ลดเวลาการรับมือกับช่องโหว่ลง 44% และเพิ่มความแม่นยำ 25%

Claude Sonnet 4.5 พร้อมให้บริการแล้วทั่วโลก นักพัฒนาสามารถใช้งานผ่าน Claude API ด้วยชื่อโมเดล claude-sonnet-4-5 ในราคาเดิมที่ 3 ดอลลาร์สำหรับ input และ 15 ดอลลาร์สำหรับ output ต่อ 1 ล้าน token เช่นเดียวกับ Claude Sonnet 4

ที่มา: https://www.anthropic.com/news/claude-sonnet-4-5

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ