Meta ปล่อย LlamaFirewall เฟรมเวิร์ก AI Agent ผสาน Protection ออกมาเป็น Open Source

ช่วงสิ้นเดือนเมษายน 2025 ที่ผ่านมา นักวิจัยจาก Meta ได้ปล่อยงานวิจัยและเครื่องมือ LlamaFirewall ออกมาเป็น Open Source โดยเผยว่ามีประสิทธิผลลดอัตราความสำเร็จในการโจมตีลงไปได้กว่า 90% จากชุดทดสอบ AgentDojo Benchmark

LlamaFirewall คือ เฟรมเวิร์กที่ออกแบบมาเพื่อตรวจจับและบรรเทาความเสี่ยงด้านความมั่นคงปลอดภัยของ AI ต่าง ๆ ผ่านการสนับสนุนหลากหลาย Layer ของทั้ง Input และ Output เช่น LLM Chat ที่จะมีตัวสแกนความเสี่ยงต่าง ๆ พร้อมสนับสนุนอยู่ภายใน

โดย LlamaFirewall จะเป็นเสมือน Real-Time Guardrail Monitor ใน Layer สุดท้ายในการป้องกันความเสี่ยงด้านความมั่นคงปลอดภัยต่อ AI Agent ซึ่งจะมีด้วยกัน 3 Protection Layer ได้แก่า

  • PromptGuard2 ตัวปกป้องการแหกคุก (Jailbreak) แบบสากล โดยเป็นโมเดลแบบ BERT ที่จะตรวจจับการ Jailbreak ที่จะวิเคราะห์ทั้ง Prompt ผู้ใช้และแหล่งข้อมูลที่ไม่น่าเชื่อถือแบบ Real-Time
  • Agent Alignment Checks ตัวตรวจสอบ Chain-of-thought ที่จะตรวจสอบการให้เหตุผลของ Agent ในกรณีที่เกิด Prompt Injection และการดำเนินการที่ไม่สอดคล้องกับเป้าหมาย
  • CodeShield ตัววิเคราะห์ออนไลน์ที่ช่วยป้องกันการสร้างโค้ดที่ไม่ปลอดภัยหรือเป็นอันตรายจาก Agent ที่เขียนโค้ด

รายละเอียดเพิ่มเติมสามารถอ่านได้ที่งานวิจัยของทาง Meta ที่บล็อกโพสของ Meta หรือที่ arXiv รวมทั้งสามารถดูโค้ดได้ที่ GitHub

ที่มา: https://www.infoq.com/news/2025/05/llamafirewall-agent-protection/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

เลือก Cloud Infrastructure ที่เหมาะกับการใช้งาน AI ระดับองค์กร [PR]

เมื่อองค์กรเริ่มนำ AI เข้ามาเป็นส่วนสำคัญในการขับเคลื่อนธุรกิจ ความพร้อมของโครงสร้างพื้นฐานจึงกลายเป็นอีกหนึ่งปัจจัยที่ไม่อาจมองข้าม จากรายงานของ McKinsey & Company (2025) ระบุว่า สัดส่วนองค์กรที่นำ AI มาใช้ในการทำงานเพิ่มขึ้นเป็น 88 เปอร์เซ็นต์ …

HPE อัดยาแรง! แจกฟรี VM Essentials 1 ปี พร้อม Zerto 1 ดอลลาร์ ดึงลูกค้า VMware

HPE ใช้จังหวะที่ VMware ปรับขึ้นค่าไลเซนส์ นำเสนอสิทธิพิเศษให้ลูกค้าใช้งานระบบ VM Essentials ฟรี 1 ปีเต็ม พร้อมสิทธิ์ใช้งานซอฟต์แวร์ปกป้องข้อมูล Zerto ในราคาเพียง 1 ดอลลาร์ …