IBM Research กำลังวิจัยทดสอบ SWE-Agent 1.0 การใช้ AI Agent หลาย ๆ ตัวให้ช่วยกันค้นหาบั๊ก (Bug) ในโค้ดที่อยู่บน GitHub พร้อมแนะนำแนวทางแก้ไขบรรเทาปัญหาได้อัตโนมัติ
Chief Scientist แห่ง IBM คุณ Ruchir Puri ได้เผยถึงการทดสอบ Software Engineering (SWE) AI Agent เวอร์ชัน 1.0 ที่มีการใช้ LLM หลาย ๆ ตัวช่วยทำงานในกระบวนการวิศวกรรมซอฟต์แวร์หลาย ๆ ส่วนให้มีความอัตโนมัติมากขึ้น
เป้าหมายหลักคือการช่วยลด Backlog ของบั๊กลดลงไปอย่างมีนัยบสำคัญ เพื่อให้นักพัฒนาระบบไม่จำเป็นจะต้องมีการเข้าไปแก้ไขปัญหาด้วยตัวเองทั้งหมด เพียงแค่กดมอบหมายให้ IBM SWE ตัว AI Agent ก็จะไปค้นหาส่วนที่มีปัญหาในโค้ด พร้อมกับแนะนำการแก้ไขเพื่อให้นักพัฒนาระบบจะสามารถกลับมารีวิวก่อนที่จะดำเนินการได้
IBM Research เผยว่าโดยเฉลี่ย SWE Agent นั้นจะสามารถระบุและแก้ไขปัญหาที่พบได้ภายใน 5 นาที และจากการทดสอบ Agent เหล่านี้ยังสามารถทดสอบผ่าน SWE-bench ได้สำเร็จอยู่ที่ 23.7% ซึ่งได้ทำให้ IBM SWE อยู่ในตำแหน่ง Leaderboard เหนือกว่าโมเดลชื่อดังอย่าง GPT-4o หรือ Claude 3 แล้ว
สำหรับรายละเอียดอื่น ๆ ของ IBM SWE-Agent 1.0 สามารถอ่านเพิ่มเติมได้ที่นี่
ที่มา: https://devops.com/ibm-develops-ai-agents-to-automate-software-engineering-tasks/