นักวิจัยจีนใช้ Llama 13B พัฒนาแชทบอทเพื่อการทหาร

มีรายงานจาก Reuters ว่านักวิจัยในประเทศจีนได้ใช้โมเดล AI Llama 13B ของ Meta ในการพัฒนาแชทบอทที่ได้รับการปรับแต่งเพื่อการทหาร ก่อให้เกิดคำถามเกี่ยวกับการใช้งาน AI แบบโอเพนซอร์สในเชิงการทหารทั้งที่มีข้อห้ามจาก Meta ก็ตาม

โมเดล Llama ที่เปิดตัวโดย Meta ในเดือนกุมภาพันธ์ 2022 เป็นตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์ส ซึ่งนักพัฒนาสามารถนำไปใช้ทั้งในโครงการวิจัยและทางการค้าโดยไม่มีค่าใช้จ่าย แม้เงื่อนไขสิทธิ์ที่กำหนดโดย Meta จะห้ามมิให้ใช้โมเดลดังกล่าวเพื่อการทหาร ทว่าในเอกสารวิจัยด้าน AI เมื่อเดือนมิถุนายนที่ผ่านมาทีซึ่งเขียนโดยนักวิจัย 6 คนจาก 3 สถาบันในจีน รวมถึง 2 แห่งภายใต้สถาบันวิทยาศาสตร์การทหารแห่งกองทัพปลดแอกประชาชนจีน ได้กล่าวโดยละเอียดถึงแชทบอท ChatBIT ที่ขับเคลื่อนด้วย Llama และปรับแต่งมาสำหรับงานสนทนาและการตอบคำถามเชิงการทหารโดยเฉพาะ

ChatBIT ใช้งาน Llama 13B ซึ่งอิงกับสถาปัตยกรรมเครือข่ายประสาทเทียม Transformer ซึ่งเป็นมาตรฐานในอุตสาหกรรมที่ได้รับการปรับแต่งเพิ่มเติมโดยวิศวกรของ Meta เพื่อพัฒนาความสามารถในการทำความเข้าใจคำสั่งที่มีความยาวมากขึ้น โดยผู้สร้างแชทบอท ChatBIT ได้ทำการปรับแต่ง Llama 13B เพิ่มเติมอีกด้วยพารามิเตอร์ของตัวเอง ทั้งยังให้แชทบอทเข้าถึงชุดบันทึกการสนทนาทางการทหารอีกกว่า 100,000 รายการ

นอกจากนี้ ยังมีเอกสาร AI อีกฉบับจากนักวิจัยของบริษัทอุตสาหกรรมการบินที่กล่าวถึงการใช้ Llama 2 ซึ่งเป็นโมเดล LLM ที่อัปเดตโดย Meta ในเดือนกรกฎาคม 2022 สำหรับกลยุทธ์การรบอิเล็กทรอนิกส์ทางอากาศ ทั้งนี้ Llama 2 ได้รับการเทรนด้วยข้อมูลปริมาณมากกว่ารุ่นก่อนถึง 40% สามารถประมวลผลคำสั่งที่มีโทเคนมากกว่าเดิมถึงสองเท่า อีกทั้งยังใช้งานเทคนิค grouped-query attention (GQA) ซึ่งช่วยเพิ่มประสิทธิภาพฮาร์ดแวร์ ลดค่าใช้จ่าย และเร่งการประมวลผลอีกด้วย

ตั้งแต่ Llama 2 เป็นต้นมา Meta ได้เปิดตัวโมเดลที่พัฒนาขึ้นมาเรื่อย ๆ อีกหลายรุ่น โดยล่าสุดคือ Llama 3.1 405B ซึ่งเปิดตัวในเดือนกรกฎาคมที่ผ่านมาและมีความสามารถในการให้เหตุผลที่ดีกว่าและสามารถประมวลผลคำสั่งที่มีข้อมูลมากกว่าอัลกอริทึมของ Llama รุ่นแรกถึง 60 เท่า โดยซีอีโอ Mark Zuckerberg กล่าวว่ากำลังพัฒนา Llama 4 ด้วยคลัสเตอร์ AI ที่ประกอบด้วยจีพียู H100 กว่าแสนตัว และจะพร้อมใช้งานในช่วงต้นปีหน้า

ที่มา: https://siliconangle.com/2024/11/01/report-chinese-researchers-used-llama-13b-build-chatbot-optimized-military-use/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ