ครบรอบ 10 ปี Google Translate; Google เผยงานวิจัย AI แปลภาษาใหม่ ใช้ในการแปลจีนเป็นอังกฤษแล้ว

เมื่อวันที่ 27 กันยายน 2016 ที่ผ่านมา เป็นวันครบรอบ 10 ปีของบริการ Google Translate และทาง Google ก็ถือเอาโอกาสนี้มาใช้ในการเปิดตัวเทคโนโลยี Google Neural Machine Translation (GNMT) สำหรับการแปลภาษาแบบใหม่ ที่เริ่มใช้จริงภายในการแปลภาษาจีนมาเป็นอังกฤษทั้งหมดแล้ว

google_gnmt

ไม่กี่ปีก่อนหน้านี้ Google ได้เริ่มใช้ Recurrent Neural Networks (RNNs) ในการเรียนรู้ Input และ Output ในแต่ละการแปลโดยตรง เพื่อนำมาใช้ในการแปลภาษาด้วยวิธีการ Neural Machine Translation (NMT) ที่พิจารณาข้อความทั้งหมดที่จะนำมาแปลเลย ต่างจากวิธีการเดิมๆ อย่าง Phrase-based Machine Translation (PBMT) ที่ต้องตัดข้อความออกเป็นคำหรือประโยคก่อนที่จะแปล โดยแรกเริ่มที่ทดสอบนั้น NMT สามารถให้ความแม่นยำได้เทียบเท่ากับ PBMT เลย

จากนั้นทีมนักวิจัยจาก Google ก็ได้ทำการปรับปรุงรูปแบบการแปล เช่น เพิ่มการจัดการกับคำที่ไม่ค่อยได้พบบ่อย, ปรับแต่งวิธีการเรียบเรียงคำใน Input และ Output และอื่นๆ แต่อย่างไรก็ดีความแม่นยำในการแปลก็ยังไม่ได้เพิ่มขึ้นสูงมากเท่าที่ควร

งานวิจัย GNMT จึงได้เริ่มต้นขึ้นด้วยการวิเคราะห์ฐานข้อมูลภาษาขนาดใหญ่ที่ Google มีอยู่ และช่วยเพิ่มความแม่นยำในการแปลให้สูงขึ้นได้เป็นอย่างมากในการนำมาใช้แปลภาษาจีน โดย GNMT จะทำการแปลงภาษาจีนให้อยู่ในรูป List ของ Vector เสียก่อน และแต่ละ Vector นั้นก็จะถูกแปลภาษาก่อนรอบหนึ่ง เรียกขั้นตอนนี้ว่า Encoder จากนั้นจึงทำการอ่านทั้งประโยค แล้วเลือกคำในภาษาอังกฤษที่ควรจะเป็นผลการแปลออกมาทีละคำด้วยการถ่วงน้ำหนักตามความสัมพันธ์ของคำใน Vector เรียกขั้นตอนนี้ว่า Decoder

ด้วยวิธีการนี้ GNMT สามารถลดความผิดพลาดในการแปลลงไปได้ 55% – 85% ในหลายๆ ภาษาจากการทดสอบกับข้อมูลบน Wikipedia และเว็บข่าวที่มีเนื้อหา 2 ภาษา ทำให้ Google ตัดสินใจนำ GNMT นี้มาใช้จริงในระบบ Production สำหรับการแปลภาษาจีนเป็นภาษาอังกฤษเลย โดย GNMT นี้ทำงานอยู่บน TensorFlow และ Tensor Processing Unit (TPU) ด้วย

สำหรับเอกสารงานวิจัยฉบับเต็ม สามารถอ่านได้ที่ http://arxiv.org/abs/1609.08144 เลยนะครับ

ที่มา: https://research.googleblog.com/2016/09/a-neural-network-for-machine.html



About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

รู้จัก Zero-Touch และ One-Touch Provisioning สองสิ่งที่ทำให้ Aruba SD-Branch ติดตั้งใช้งานได้ง่าย

จุดเด่นหนึ่งของโซลูชัน SD-WAN ที่เป็นสากลนั้นก็คือความง่ายดายในการติดตั้งใช้งาน เพื่อให้การขึ้นระบบ SD-WAN ที่มักกระจายอยู่หลายสาขาในพื้นที่ที่ห่างไกลกันและกันนั้นเป็นไปได้อย่างรวดเร็ว และไม่ต้องอาศัยผู้ที่มีความรู้เชิงเทคนิคในการติดตั้งอุปกรณ์ที่แต่ละสาขา ซึ่ง Aruba SD-Branch ที่ครอบคลุมความสามารถ SD-WAN เองก็สามารถตอบโจทย์เรื่องความง่ายดายนี้ได้ด้วยสองเทคนิคที่มีชื่อว่า Zero-Touch Provisioning (ZTP) และ One-Touch Provisioning (OTP) นั่นเอง

Facebook เผยเริ่มใช้ QUIC และ HTTP/3 กับผู้ใช้งานทั่วโลกกว่า 75% แล้ว

Facebook ได้ออกมาเขียน Technical Blog ถึงการเปลี่ยนการเชื่อมต่อจากผู้ใช้งาน Facebook ให้กลายเป็น QUIC และ HTTP/3 สำเร็จไปแล้วกว่า 75% ของทราฟฟิกที่เชื่อมต่อเข้ามายัง Facebook ทั้งหมดในเวลานี้ และพบว่า QUIC สามารถช่วยให้ประสบการณ์ของผู้ใช้งานดีขึ้นได้เป็นอย่างมาก