Tencent Holdings ได้เปิดเผยซอร์สชุดโมเดลภาษารุ่นใหม่ชื่อ Hunyuan-MT ซึ่งถูกออกแบบมาให้เหมาะสมกับงานด้านการแปลโดยเฉพาะ

บริษัทเทคโนโลยีจากจีนระบุว่า อัลกอริทึมดังกล่าวมีประสิทธิภาพสูงกว่า Google Translate อย่างชัดเจนในการทดสอบมาตรฐานการแปลด้วยปัญญาประดิษฐ์ที่ได้รับความนิยม
ชุดโมเดล Hunyuan-MT ประกอบด้วยสี่โมเดล โดยสองโมเดลหลักคือ Hunyuan-MT-7B และ Hunyuan-MT-Chimera-7B ซึ่งมีจำนวนพารามิเตอร์ 7 พันล้านตัว ส่วนอีกสองโมเดลเป็นเวอร์ชันที่ถูกทำให้มีขนาดเล็กลง (quantized) เพื่อลดการใช้หน่วยความจำ โดยยอมแลกกับคุณภาพผลลัพธ์ที่ลดลงเล็กน้อย
Tencent ใช้ข้อมูลสี่ชุดในการฝึกเบื้องต้น โดยสองชุดแรกประกอบด้วยข้อความที่เขียนใน 33 ภาษา แต่ไม่มีข้อมูลที่เกี่ยวข้องกับวิธีการแปล ส่วนอีกสองชุดเป็นข้อมูลคู่หลายล้านรายการ ซึ่งแต่ละคู่ประกอบด้วยข้อความและคำแปล
ตามที่ Tencent ระบุ กระบวนการฝึกทำให้โมเดล Hunyuan-MT ไม่เพียงแต่มีความสามารถในการแปล แต่ยังมีความรู้ทั่วไปในระดับสูง บริษัทได้ทดสอบโมเดลด้วยเกณฑ์มาตรฐานความรู้ทั่วไปชื่อ MMLU-Pro ซึ่ง Hunyuan-MT ทำคะแนนได้ดีกว่า Llama-3-8B-Base ซึ่งเป็นโมเดลที่มีพารามิเตอร์ 8 พันล้านตัว อย่างมีนัยสำคัญ
หลังจากการฝึกเบื้องต้น Tencent ได้เพิ่มขั้นตอนการเรียนรู้แบบเสริมกำลัง โดยให้โมเดล Hunyuan-MT ทำงานแปลหลายชุดและข้อเสนอแนะเกี่ยวกับคุณภาพของคำตอบ เพื่อนำไปปรับปรุงผลลัพธ์ให้ดีขึ้น
กระบวนการเรียนรู้แบบลองผิดลองถูกนี้อยู่ภายใต้การกำกับดูแลของโมเดล AI ที่ถูกออกแบบเฉพาะ ซึ่งจะให้คะแนนการแปลจาก Hunyuan-MT ตามความใกล้เคียงเชิงความหมายกับข้อความต้นฉบับ และยังพิจารณาปัจจัยอื่น ๆ เช่น ความสามารถในการจัดการคำศัพท์เฉพาะทาง
โมเดลแรกของชุด Hunyuan-MT อย่าง Hunyuan-MT-7B ใช้สถาปัตยกรรมโมเดลภาษามาตรฐาน ขณะที่ Hunyuan-MT-Chimera-7B ใช้วิธีการประมวลผลที่ซับซ้อนกว่าเรียกว่า ensemble learning ซึ่งคล้ายกับโมเดล mixture-of-experts แต่ต่างกันที่ ensemble learning จะใช้เครือข่ายประสาทเทียมทั้งหมดในการประมวลผลคำสั่งของผู้ใช้ จากนั้นสร้างหลายคำตอบแล้วรวมเข้าด้วยกันเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพสูงกว่า
Tencent ได้นำ Hunyuan-MT ไปเปรียบเทียบกับ Google Translate โดยใช้เกณฑ์มาตรฐานการแปลด้วย AI ที่ชื่อ WMT25 ผลการทดสอบระบุว่า โมเดลชุดนี้ทำคะแนนได้ดีกว่าใน 30 จาก 31 คู่ภาษาที่ประเมิน บางกรณีทำคะแนนสูงกว่าถึง 65%
นอกจากนี้ โมเดล Hunyuan-MT ยังทำคะแนนได้ดีกว่าอัลกอริทึมจากผู้ให้บริการ AI รายอื่น โดย Tencent ระบุว่า Hunyuan-MT มีคะแนนสูงกว่า GPT-4.1 และ Claude 4 Sonnet ของ Anthropic ในคู่ภาษาส่วนใหญ่ที่ใช้ทดสอบในเกณฑ์ WMT25
ที่มา: https://siliconangle.com/2025/09/01/tencent-open-sources-hunyuan-mt-translation-model-series/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






