Anthropic เปิดตัว Claude Sonnet 4.5

Anthropic ประกาศเปิดตัว Claude Sonnet 4.5 โมเดล AI ใหม่ล่าสุดที่มีความสามารถโดดเด่นในการเขียนโค้ด สร้าง Agent ที่ซับซ้อน และใช้งานคอมพิวเตอร์ได้ดีที่สุดในขณะนี้ พร้อมเปิดให้นักพัฒนาใช้งานผ่าน API ทันทีในราคาเดิม

Credit: Anthropic

Claude Sonnet 4.5 เป็นโมเดลที่ทำคะแนนสูงสุดบน SWE-bench Verified ซึ่งเป็นการทดสอบความสามารถในการเขียนโค้ดซอฟต์แวร์จริง โดยสามารถรักษาสมาธิในการทำงานที่ซับซ้อนหลายขั้นตอนได้นานกว่า 30 ชั่วโมง บนการทดสอบ OSWorld ที่วัดความสามารถในการใช้คอมพิวเตอร์จริง Sonnet 4.5 ทำคะแนนได้ 61.4% เพิ่มขึ้นจาก 42.2% ของ Sonnet 4 เมื่อ 4 เดือนก่อน นอกจากนี้ยังมีการปรับปรุงความสามารถด้านการใช้เหตุผลและคณิตศาสตร์อย่างมีนัยสำคัญ

Anthropic ได้อัปเดตผลิตภัณฑ์หลายรายการควบคู่กับการเปิดตัวโมเดลใหม่นี้ Claude Code ได้รับฟีเจอร์ checkpoint ที่ช่วยบันทึกความคืบหน้าและย้อนกลับได้ พร้อมอินเตอร์เฟซ terminal ใหม่และ extension สำหรับ VS Code ส่วน Claude API ได้ฟีเจอร์แก้ไข context และเครื่องมือ memory ที่ช่วยให้ agent ทำงานได้นานขึ้น ในแอปพลิเคชัน Claude สามารถรันโค้ดและสร้างไฟล์ต่างๆ เช่น spreadsheet, slide และ document ได้โดยตรงในการสนทนา รวมถึง Claude for Chrome extension สำหรับสมาชิก Max

ที่สำคัญคือ Anthropic ได้เปิดตัว Claude Agent SDK ซึ่งเป็นโครงสร้างพื้นฐานเดียวกับที่ใช้พัฒนา Claude Code ให้นักพัฒนาสามารถนำไปสร้าง agent ของตนเองได้ SDK นี้รวบรวมประสบการณ์กว่า 6 เดือนในการแก้ปัญหาที่ซับซ้อน เช่น การจัดการ memory สำหรับงานระยะยาว ระบบ permission ที่สมดุลระหว่างความอิสระกับการควบคุม และการประสานงานระหว่าง subagent หลายตัว

Claude Sonnet 4.5 ยังเป็นโมเดลที่มีการจัดตำแหน่งดีที่สุดของ Anthropic โดยลดพฤติกรรมที่น่ากังวลหลายอย่าง เช่น การเอาใจ การหลอกลวง การแสวงหาอำนาจ และการส่งเสริมความคิดที่ผิดจากความเป็นจริง สำหรับความสามารถ agentic และการใช้คอมพิวเตอร์ ยังมีความก้าวหน้าในการป้องกันการโจมตีแบบ prompt injection ซึ่งเป็นความเสี่ยงสำคัญสำหรับผู้ใช้งาน โมเดลนี้ถูกเผยแพร่ภายใต้มาตรการป้องกัน AI Safety Level 3 (ASL-3) ตามกรอบการทำงานที่จับคู่ความสามารถของโมเดลกับมาตรการป้องกันที่เหมาะสม

Credit: Anthropic

ลูกค้าที่ใช้งานเบื้องต้นต่างก็ให้ผลตอบรับเป็นบวก Cursor รายงานว่าเห็นประสิทธิภาพการเขียนโค้ดระดับ state-of-the-art พร้อมการปรับปรุงที่สำคัญในงานระยะยาว GitHub Copilot พบการปรับปรุงในการใช้เหตุผลหลายขั้นตอนและความเข้าใจโค้ด Codeium รายงานว่าอัตราข้อผิดพลาดลดลงจาก 9% บน Sonnet 4 เหลือ 0% บน benchmark การแก้ไขโค้ดภายใน ขณะที่ Hai รายงานว่า Sonnet 4.5 ลดเวลาการรับมือกับช่องโหว่ลง 44% และเพิ่มความแม่นยำ 25%

Claude Sonnet 4.5 พร้อมให้บริการแล้วทั่วโลก นักพัฒนาสามารถใช้งานผ่าน Claude API ด้วยชื่อโมเดล claude-sonnet-4-5 ในราคาเดิมที่ 3 ดอลลาร์สำหรับ input และ 15 ดอลลาร์สำหรับ output ต่อ 1 ล้าน token เช่นเดียวกับ Claude Sonnet 4

ที่มา: https://www.anthropic.com/news/claude-sonnet-4-5

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

VMware เปิดตัว VCF 9.1 ยกระดับ Private Cloud เพิ่มความคุ้มค่าและความปลอดภัย ตอบโจทย์ยุค AI

VMware ได้ประกาศเปิดตัว VMware Cloud Foundation หรือ VCF 9.1 อย่างเป็นทางการ หวังยกระดับ Private Cloud ให้เป็นแพลตฟอร์มที่บริหารจัดการได้ง่าย คุ้มค่าต่อการลงทุน และมาพร้อมกับระบบรักษาความปลอดภัยที่แข็งแกร่งตั้งแต่ระดับโครงสร้างพื้นฐาน …