Tencent ปล่อยชุดโมเดลแปลภาษา Hunyuan-MT เป็นโอเพนซอร์ส

Tencent Holdings ได้เปิดเผยซอร์สชุดโมเดลภาษารุ่นใหม่ชื่อ Hunyuan-MT ซึ่งถูกออกแบบมาให้เหมาะสมกับงานด้านการแปลโดยเฉพาะ

บริษัทเทคโนโลยีจากจีนระบุว่า อัลกอริทึมดังกล่าวมีประสิทธิภาพสูงกว่า Google Translate อย่างชัดเจนในการทดสอบมาตรฐานการแปลด้วยปัญญาประดิษฐ์ที่ได้รับความนิยม

ชุดโมเดล Hunyuan-MT ประกอบด้วยสี่โมเดล โดยสองโมเดลหลักคือ Hunyuan-MT-7B และ Hunyuan-MT-Chimera-7B ซึ่งมีจำนวนพารามิเตอร์ 7 พันล้านตัว ส่วนอีกสองโมเดลเป็นเวอร์ชันที่ถูกทำให้มีขนาดเล็กลง (quantized) เพื่อลดการใช้หน่วยความจำ โดยยอมแลกกับคุณภาพผลลัพธ์ที่ลดลงเล็กน้อย

Tencent ใช้ข้อมูลสี่ชุดในการฝึกเบื้องต้น โดยสองชุดแรกประกอบด้วยข้อความที่เขียนใน 33 ภาษา แต่ไม่มีข้อมูลที่เกี่ยวข้องกับวิธีการแปล ส่วนอีกสองชุดเป็นข้อมูลคู่หลายล้านรายการ ซึ่งแต่ละคู่ประกอบด้วยข้อความและคำแปล

ตามที่ Tencent ระบุ กระบวนการฝึกทำให้โมเดล Hunyuan-MT ไม่เพียงแต่มีความสามารถในการแปล แต่ยังมีความรู้ทั่วไปในระดับสูง บริษัทได้ทดสอบโมเดลด้วยเกณฑ์มาตรฐานความรู้ทั่วไปชื่อ MMLU-Pro ซึ่ง Hunyuan-MT ทำคะแนนได้ดีกว่า Llama-3-8B-Base ซึ่งเป็นโมเดลที่มีพารามิเตอร์ 8 พันล้านตัว อย่างมีนัยสำคัญ

หลังจากการฝึกเบื้องต้น Tencent ได้เพิ่มขั้นตอนการเรียนรู้แบบเสริมกำลัง โดยให้โมเดล Hunyuan-MT ทำงานแปลหลายชุดและข้อเสนอแนะเกี่ยวกับคุณภาพของคำตอบ เพื่อนำไปปรับปรุงผลลัพธ์ให้ดีขึ้น

กระบวนการเรียนรู้แบบลองผิดลองถูกนี้อยู่ภายใต้การกำกับดูแลของโมเดล AI ที่ถูกออกแบบเฉพาะ ซึ่งจะให้คะแนนการแปลจาก Hunyuan-MT ตามความใกล้เคียงเชิงความหมายกับข้อความต้นฉบับ และยังพิจารณาปัจจัยอื่น ๆ เช่น ความสามารถในการจัดการคำศัพท์เฉพาะทาง

โมเดลแรกของชุด Hunyuan-MT อย่าง Hunyuan-MT-7B ใช้สถาปัตยกรรมโมเดลภาษามาตรฐาน ขณะที่ Hunyuan-MT-Chimera-7B ใช้วิธีการประมวลผลที่ซับซ้อนกว่าเรียกว่า ensemble learning ซึ่งคล้ายกับโมเดล mixture-of-experts แต่ต่างกันที่ ensemble learning จะใช้เครือข่ายประสาทเทียมทั้งหมดในการประมวลผลคำสั่งของผู้ใช้ จากนั้นสร้างหลายคำตอบแล้วรวมเข้าด้วยกันเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพสูงกว่า

Tencent ได้นำ Hunyuan-MT ไปเปรียบเทียบกับ Google Translate โดยใช้เกณฑ์มาตรฐานการแปลด้วย AI ที่ชื่อ WMT25 ผลการทดสอบระบุว่า โมเดลชุดนี้ทำคะแนนได้ดีกว่าใน 30 จาก 31 คู่ภาษาที่ประเมิน บางกรณีทำคะแนนสูงกว่าถึง 65%

นอกจากนี้ โมเดล Hunyuan-MT ยังทำคะแนนได้ดีกว่าอัลกอริทึมจากผู้ให้บริการ AI รายอื่น โดย Tencent ระบุว่า Hunyuan-MT มีคะแนนสูงกว่า GPT-4.1 และ Claude 4 Sonnet ของ Anthropic ในคู่ภาษาส่วนใหญ่ที่ใช้ทดสอบในเกณฑ์ WMT25

ที่มา: https://siliconangle.com/2025/09/01/tencent-open-sources-hunyuan-mt-translation-model-series/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

Extreme Networks เปิดตัว Wi-Fi 7 AP รุ่นใหม่ พร้อม Agentic AI สำหรับบริหารจัดการระบบเครือข่ายแบบอัตโนมัติ

Extreme Networks ได้ออกมาประกาศถึงอัปเดตครั้งใหญ่ โดยเปิดตัว Wi-Fi 7 Access Point รุ่นใหม่ล่าสุด 5 รุ่น พร้อมนวัตกรรมใหม่ในการบริหารจัดการระบบเครือข่ายด้วย AI Agent เพื่อดูแลรักษาระบบเครือข่ายขององค์กรให้ทำงานได้อย่างต่อเนื่องโดยอัตโนมัติ