Tencent ปล่อยชุดโมเดลแปลภาษา Hunyuan-MT เป็นโอเพนซอร์ส

September 2, 2025 AI, Cloud and Systems, Products, Tencent

Tencent Holdings ได้เปิดเผยซอร์สชุดโมเดลภาษารุ่นใหม่ชื่อ Hunyuan-MT ซึ่งถูกออกแบบมาให้เหมาะสมกับงานด้านการแปลโดยเฉพาะ

บริษัทเทคโนโลยีจากจีนระบุว่า อัลกอริทึมดังกล่าวมีประสิทธิภาพสูงกว่า Google Translate อย่างชัดเจนในการทดสอบมาตรฐานการแปลด้วยปัญญาประดิษฐ์ที่ได้รับความนิยม

ชุดโมเดล Hunyuan-MT ประกอบด้วยสี่โมเดล โดยสองโมเดลหลักคือ Hunyuan-MT-7B และ Hunyuan-MT-Chimera-7B ซึ่งมีจำนวนพารามิเตอร์ 7 พันล้านตัว ส่วนอีกสองโมเดลเป็นเวอร์ชันที่ถูกทำให้มีขนาดเล็กลง (quantized) เพื่อลดการใช้หน่วยความจำ โดยยอมแลกกับคุณภาพผลลัพธ์ที่ลดลงเล็กน้อย

Tencent ใช้ข้อมูลสี่ชุดในการฝึกเบื้องต้น โดยสองชุดแรกประกอบด้วยข้อความที่เขียนใน 33 ภาษา แต่ไม่มีข้อมูลที่เกี่ยวข้องกับวิธีการแปล ส่วนอีกสองชุดเป็นข้อมูลคู่หลายล้านรายการ ซึ่งแต่ละคู่ประกอบด้วยข้อความและคำแปล

ตามที่ Tencent ระบุ กระบวนการฝึกทำให้โมเดล Hunyuan-MT ไม่เพียงแต่มีความสามารถในการแปล แต่ยังมีความรู้ทั่วไปในระดับสูง บริษัทได้ทดสอบโมเดลด้วยเกณฑ์มาตรฐานความรู้ทั่วไปชื่อ MMLU-Pro ซึ่ง Hunyuan-MT ทำคะแนนได้ดีกว่า Llama-3-8B-Base ซึ่งเป็นโมเดลที่มีพารามิเตอร์ 8 พันล้านตัว อย่างมีนัยสำคัญ

หลังจากการฝึกเบื้องต้น Tencent ได้เพิ่มขั้นตอนการเรียนรู้แบบเสริมกำลัง โดยให้โมเดล Hunyuan-MT ทำงานแปลหลายชุดและข้อเสนอแนะเกี่ยวกับคุณภาพของคำตอบ เพื่อนำไปปรับปรุงผลลัพธ์ให้ดีขึ้น

กระบวนการเรียนรู้แบบลองผิดลองถูกนี้อยู่ภายใต้การกำกับดูแลของโมเดล AI ที่ถูกออกแบบเฉพาะ ซึ่งจะให้คะแนนการแปลจาก Hunyuan-MT ตามความใกล้เคียงเชิงความหมายกับข้อความต้นฉบับ และยังพิจารณาปัจจัยอื่น ๆ เช่น ความสามารถในการจัดการคำศัพท์เฉพาะทาง

โมเดลแรกของชุด Hunyuan-MT อย่าง Hunyuan-MT-7B ใช้สถาปัตยกรรมโมเดลภาษามาตรฐาน ขณะที่ Hunyuan-MT-Chimera-7B ใช้วิธีการประมวลผลที่ซับซ้อนกว่าเรียกว่า ensemble learning ซึ่งคล้ายกับโมเดล mixture-of-experts แต่ต่างกันที่ ensemble learning จะใช้เครือข่ายประสาทเทียมทั้งหมดในการประมวลผลคำสั่งของผู้ใช้ จากนั้นสร้างหลายคำตอบแล้วรวมเข้าด้วยกันเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพสูงกว่า

Tencent ได้นำ Hunyuan-MT ไปเปรียบเทียบกับ Google Translate โดยใช้เกณฑ์มาตรฐานการแปลด้วย AI ที่ชื่อ WMT25 ผลการทดสอบระบุว่า โมเดลชุดนี้ทำคะแนนได้ดีกว่าใน 30 จาก 31 คู่ภาษาที่ประเมิน บางกรณีทำคะแนนสูงกว่าถึง 65%

นอกจากนี้ โมเดล Hunyuan-MT ยังทำคะแนนได้ดีกว่าอัลกอริทึมจากผู้ให้บริการ AI รายอื่น โดย Tencent ระบุว่า Hunyuan-MT มีคะแนนสูงกว่า GPT-4.1 และ Claude 4 Sonnet ของ Anthropic ในคู่ภาษาส่วนใหญ่ที่ใช้ทดสอบในเกณฑ์ WMT25

ที่มา: https://siliconangle.com/2025/09/01/tencent-open-sources-hunyuan-mt-translation-model-series/

Dell Technologies ปรับโฉมใหม่ Dell Pro รุกตลาด AI กรุยทางสู่อนาคตการใช้งานระดับองค์กร

เทรนด์ของ AI PCs กำลังมีบทบาทมากขึ้นในปัจจุบัน ซึ่ง IDC คาดการณ์ว่าความต้องการของ AI PCs จะมีแต่ถูกเร่งขึ้นเรื่อยๆ เพราะ AI ได้แทรกเข้าไปในแทบทุกส่วนของการทำงาน ไม่ว่าจะเป็นการประชุม การสร้างคอนเท้นต์ …

NCSA ร่วมกับ Veeam ขอเชิญทุกท่านเข้าร่วมงานสัมมนาออนไลน์ในหัวข้อ “Data Trust ในยุค AI” [4 ส.ค. 2569 — 14.00น.]

NCSA ร่วมกับ Veeam ขอเชิญทุกท่านเข้าร่วมงานสัมมนาออนไลน์ในหัวข้อ “Data Trust ในยุค AI” เพื่อเรียนรู้กับการป้องกันไม่ให้ข้อมูลสำคัญขององค์กรหรือหน่วยงาน รั่วไหลไปกับการใช้งาน AI Agent ที่มีความรวดเร็วและซับซ้อนขึ้นเรื่อยๆ ด้วยมาตรการต่างๆ เช่น …

TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

Tencent ปล่อยชุดโมเดลแปลภาษา Hunyuan-MT เป็นโอเพนซอร์ส

About นักเขียนฝึกหัดหมายเลขเก้า

Related Articles

Check Also

Dell Technologies ปรับโฉมใหม่ Dell Pro รุกตลาด AI กรุยทางสู่อนาคตการใช้งานระดับองค์กร

NCSA ร่วมกับ Veeam ขอเชิญทุกท่านเข้าร่วมงานสัมมนาออนไลน์ในหัวข้อ “Data Trust ในยุค AI” [4 ส.ค. 2569 — 14.00น.]

Tencent ปล่อยชุดโมเดลแปลภาษา Hunyuan-MT เป็นโอเพนซอร์ส

Share this:

About นักเขียนฝึกหัดหมายเลขเก้า

Related Articles

Check Also