Amazon เปิดตัว Nova Act ซึ่งเป็น AI Agent ตัวใหม่ที่สามารถควบคุมเว็บเบราว์เซอร์และดำเนินการแทนผู้ใช้งานได้ พร้อมเผยแพร่ Nova Act SDK สำหรับนักพัฒนาที่ต้องการสร้าง AI Agent ของตนเอง

Amazon.com Inc. ได้ประกาศเปิดตัว Nova Act AI Agent ซึ่งเป็นเทคโนโลยีแบบ Research Preview ที่พัฒนาโดย Amazon AGI San Francisco Lab ที่เพิ่งเปิดตัวไปไม่นาน Nova Act สามารถทำงานพื้นฐานในเว็บเบราว์เซอร์แทนผู้ใช้งานได้ เช่น การคลิกปุ่ม และการกรอกข้อมูลในฟอร์มต่างๆ โดยสามารถเข้าใจองค์ประกอบของ UI และโต้ตอบกับเว็บเพจในลักษณะเดียวกับการใช้งานของมนุษย์ AI Agent นี้สามารถเข้าใจภาพและตีความองค์ประกอบต่างๆ บนเว็บไซต์ สามารถคลิกปุ่ม, กรอกแบบฟอร์ม, เลื่อนหน้าเว็บ และเลือกวันที่บนปฏิทินได้
นอกจากการเปิดตัว Nova Act แล้ว Amazon ยังได้เปิดให้ใช้งานเว็บไซต์ nova.amazon.com ซึ่งเป็นพื้นที่สำหรับนักพัฒนาและผู้สนใจทั่วไปในการทดลองใช้งาน Amazon Nova Foundation Models ซึ่งเปิดตัวไปเมื่อเดือนธันวาคม 2024 ประกอบด้วยโมเดลสร้างข้อความสามรุ่น (Micro, Lite และ Pro) รวมถึงโมเดลสำหรับสร้างภาพและวิดีโอจากข้อความและรูปภาพที่มีชื่อว่า Canvas และ Reel โดย Nova Act SDK ช่วยให้นักพัฒนาสามารถแยกกระบวนการทำงานที่ซับซ้อนเป็นคำสั่งย่อยๆ ที่เชื่อถือได้ เช่น การค้นหา, การชำระเงิน, การตอบคำถามเกี่ยวกับหน้าจอ นอกจากนี้ยังสามารถเพิ่มคำแนะนำเฉพาะทางให้กับคำสั่งเหล่านั้นเพื่อเพิ่มความน่าเชื่อถือในการทำงาน ตัวอย่างงานที่ Nova Act สามารถทำได้ เช่น การค้นหา “อพาร์ตเมนต์ที่อยู่ในระยะการปั่นจักรยานจากสถานีรถไฟ”
Nova Act ถือเป็นก้าวสำคัญของ Amazon ในการแข่งขันกับคู่แข่งอย่าง OpenAI ที่มี Operator และ Anthropic ที่มี Computer Use ซึ่งเป็นเทคโนโลยี AI Agent ที่มีความสามารถคล้ายกัน
ที่มา: https://siliconangle.com/2025/03/31/amazon-introduces-nova-act-ai-agent-can-use-web-browser/