เมื่อวันที่ 27 กันยายน 2016 ที่ผ่านมา เป็นวันครบรอบ 10 ปีของบริการ Google Translate และทาง Google ก็ถือเอาโอกาสนี้มาใช้ในการเปิดตัวเทคโนโลยี Google Neural Machine Translation (GNMT) สำหรับการแปลภาษาแบบใหม่ ที่เริ่มใช้จริงภายในการแปลภาษาจีนมาเป็นอังกฤษทั้งหมดแล้ว
ไม่กี่ปีก่อนหน้านี้ Google ได้เริ่มใช้ Recurrent Neural Networks (RNNs) ในการเรียนรู้ Input และ Output ในแต่ละการแปลโดยตรง เพื่อนำมาใช้ในการแปลภาษาด้วยวิธีการ Neural Machine Translation (NMT) ที่พิจารณาข้อความทั้งหมดที่จะนำมาแปลเลย ต่างจากวิธีการเดิมๆ อย่าง Phrase-based Machine Translation (PBMT) ที่ต้องตัดข้อความออกเป็นคำหรือประโยคก่อนที่จะแปล โดยแรกเริ่มที่ทดสอบนั้น NMT สามารถให้ความแม่นยำได้เทียบเท่ากับ PBMT เลย
จากนั้นทีมนักวิจัยจาก Google ก็ได้ทำการปรับปรุงรูปแบบการแปล เช่น เพิ่มการจัดการกับคำที่ไม่ค่อยได้พบบ่อย, ปรับแต่งวิธีการเรียบเรียงคำใน Input และ Output และอื่นๆ แต่อย่างไรก็ดีความแม่นยำในการแปลก็ยังไม่ได้เพิ่มขึ้นสูงมากเท่าที่ควร
งานวิจัย GNMT จึงได้เริ่มต้นขึ้นด้วยการวิเคราะห์ฐานข้อมูลภาษาขนาดใหญ่ที่ Google มีอยู่ และช่วยเพิ่มความแม่นยำในการแปลให้สูงขึ้นได้เป็นอย่างมากในการนำมาใช้แปลภาษาจีน โดย GNMT จะทำการแปลงภาษาจีนให้อยู่ในรูป List ของ Vector เสียก่อน และแต่ละ Vector นั้นก็จะถูกแปลภาษาก่อนรอบหนึ่ง เรียกขั้นตอนนี้ว่า Encoder จากนั้นจึงทำการอ่านทั้งประโยค แล้วเลือกคำในภาษาอังกฤษที่ควรจะเป็นผลการแปลออกมาทีละคำด้วยการถ่วงน้ำหนักตามความสัมพันธ์ของคำใน Vector เรียกขั้นตอนนี้ว่า Decoder
ด้วยวิธีการนี้ GNMT สามารถลดความผิดพลาดในการแปลลงไปได้ 55% – 85% ในหลายๆ ภาษาจากการทดสอบกับข้อมูลบน Wikipedia และเว็บข่าวที่มีเนื้อหา 2 ภาษา ทำให้ Google ตัดสินใจนำ GNMT นี้มาใช้จริงในระบบ Production สำหรับการแปลภาษาจีนเป็นภาษาอังกฤษเลย โดย GNMT นี้ทำงานอยู่บน TensorFlow และ Tensor Processing Unit (TPU) ด้วย
สำหรับเอกสารงานวิจัยฉบับเต็ม สามารถอ่านได้ที่ http://arxiv.org/abs/1609.08144 เลยนะครับ
ที่มา: https://research.googleblog.com/2016/09/a-neural-network-for-machine.html