ครบรอบ 10 ปี Google Translate; Google เผยงานวิจัย AI แปลภาษาใหม่ ใช้ในการแปลจีนเป็นอังกฤษแล้ว

เมื่อวันที่ 27 กันยายน 2016 ที่ผ่านมา เป็นวันครบรอบ 10 ปีของบริการ Google Translate และทาง Google ก็ถือเอาโอกาสนี้มาใช้ในการเปิดตัวเทคโนโลยี Google Neural Machine Translation (GNMT) สำหรับการแปลภาษาแบบใหม่ ที่เริ่มใช้จริงภายในการแปลภาษาจีนมาเป็นอังกฤษทั้งหมดแล้ว

google_gnmt

ไม่กี่ปีก่อนหน้านี้ Google ได้เริ่มใช้ Recurrent Neural Networks (RNNs) ในการเรียนรู้ Input และ Output ในแต่ละการแปลโดยตรง เพื่อนำมาใช้ในการแปลภาษาด้วยวิธีการ Neural Machine Translation (NMT) ที่พิจารณาข้อความทั้งหมดที่จะนำมาแปลเลย ต่างจากวิธีการเดิมๆ อย่าง Phrase-based Machine Translation (PBMT) ที่ต้องตัดข้อความออกเป็นคำหรือประโยคก่อนที่จะแปล โดยแรกเริ่มที่ทดสอบนั้น NMT สามารถให้ความแม่นยำได้เทียบเท่ากับ PBMT เลย

จากนั้นทีมนักวิจัยจาก Google ก็ได้ทำการปรับปรุงรูปแบบการแปล เช่น เพิ่มการจัดการกับคำที่ไม่ค่อยได้พบบ่อย, ปรับแต่งวิธีการเรียบเรียงคำใน Input และ Output และอื่นๆ แต่อย่างไรก็ดีความแม่นยำในการแปลก็ยังไม่ได้เพิ่มขึ้นสูงมากเท่าที่ควร

งานวิจัย GNMT จึงได้เริ่มต้นขึ้นด้วยการวิเคราะห์ฐานข้อมูลภาษาขนาดใหญ่ที่ Google มีอยู่ และช่วยเพิ่มความแม่นยำในการแปลให้สูงขึ้นได้เป็นอย่างมากในการนำมาใช้แปลภาษาจีน โดย GNMT จะทำการแปลงภาษาจีนให้อยู่ในรูป List ของ Vector เสียก่อน และแต่ละ Vector นั้นก็จะถูกแปลภาษาก่อนรอบหนึ่ง เรียกขั้นตอนนี้ว่า Encoder จากนั้นจึงทำการอ่านทั้งประโยค แล้วเลือกคำในภาษาอังกฤษที่ควรจะเป็นผลการแปลออกมาทีละคำด้วยการถ่วงน้ำหนักตามความสัมพันธ์ของคำใน Vector เรียกขั้นตอนนี้ว่า Decoder

ด้วยวิธีการนี้ GNMT สามารถลดความผิดพลาดในการแปลลงไปได้ 55% – 85% ในหลายๆ ภาษาจากการทดสอบกับข้อมูลบน Wikipedia และเว็บข่าวที่มีเนื้อหา 2 ภาษา ทำให้ Google ตัดสินใจนำ GNMT นี้มาใช้จริงในระบบ Production สำหรับการแปลภาษาจีนเป็นภาษาอังกฤษเลย โดย GNMT นี้ทำงานอยู่บน TensorFlow และ Tensor Processing Unit (TPU) ด้วย

สำหรับเอกสารงานวิจัยฉบับเต็ม สามารถอ่านได้ที่ http://arxiv.org/abs/1609.08144 เลยนะครับ

ที่มา: https://research.googleblog.com/2016/09/a-neural-network-for-machine.html



About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

NTT พร้อมเปิดให้บริการ Data Center เฟสใหม่ ที่ NTT Bangkok 2 Data Center แล้ว รองรับ AI Workload ได้ด้วยกำลังไฟ 6kW –40kW ต่อ Rack

หลังจากปี 2019 ที่ผ่านมา ทาง NTT ได้ประกาศลงทุนเพิ่มอีก 500 ล้านบาท สำหรับการขยายเฟส 3 ที่ NTT Bangkok 2 Data Center ภายใต้แบรนด์ Nexcenter เพื่อให้บริการ Data Center สำหรับธุรกิจองค์กรมาตรฐานสูง ขณะนี้ทาง NTT พร้อมให้บริการในเฟส 3 แล้ว ด้วยความสามารถรูปแบบใหม่ที่ออกแบบมาเพื่อรองรับ Workload ที่ต้องใช้พลังงานในการประมวลผลสูง อย่าง AI (Artificial Intelligence) หรือ (HPC) High Performance Computing ได้เป็นอย่างดี

โปรโมชั่นต้อนรับเทศกาลตรุษจีนและวันแห่งความรัก สำหรับ Veritas SaaS Backup (VSB) “Forever Love Promotion”

Veritas จัดโปรโมชั่นพิเศษสุดๆเพื่อต้อนรับเทศกาลตรุษจีน ปีหนูทอง และวันแห่งความรัก โดย มอบอั่งเปาพิเศษพร้อมความรักตลอดกาล เป็น Veritas SaaS Backup License ใช้งานฟรี 1 ปี* แก่ลูกค้าทุกท่าน