IBM Flashsystem

ครบรอบ 10 ปี Google Translate; Google เผยงานวิจัย AI แปลภาษาใหม่ ใช้ในการแปลจีนเป็นอังกฤษแล้ว

เมื่อวันที่ 27 กันยายน 2016 ที่ผ่านมา เป็นวันครบรอบ 10 ปีของบริการ Google Translate และทาง Google ก็ถือเอาโอกาสนี้มาใช้ในการเปิดตัวเทคโนโลยี Google Neural Machine Translation (GNMT) สำหรับการแปลภาษาแบบใหม่ ที่เริ่มใช้จริงภายในการแปลภาษาจีนมาเป็นอังกฤษทั้งหมดแล้ว

google_gnmt

ไม่กี่ปีก่อนหน้านี้ Google ได้เริ่มใช้ Recurrent Neural Networks (RNNs) ในการเรียนรู้ Input และ Output ในแต่ละการแปลโดยตรง เพื่อนำมาใช้ในการแปลภาษาด้วยวิธีการ Neural Machine Translation (NMT) ที่พิจารณาข้อความทั้งหมดที่จะนำมาแปลเลย ต่างจากวิธีการเดิมๆ อย่าง Phrase-based Machine Translation (PBMT) ที่ต้องตัดข้อความออกเป็นคำหรือประโยคก่อนที่จะแปล โดยแรกเริ่มที่ทดสอบนั้น NMT สามารถให้ความแม่นยำได้เทียบเท่ากับ PBMT เลย

จากนั้นทีมนักวิจัยจาก Google ก็ได้ทำการปรับปรุงรูปแบบการแปล เช่น เพิ่มการจัดการกับคำที่ไม่ค่อยได้พบบ่อย, ปรับแต่งวิธีการเรียบเรียงคำใน Input และ Output และอื่นๆ แต่อย่างไรก็ดีความแม่นยำในการแปลก็ยังไม่ได้เพิ่มขึ้นสูงมากเท่าที่ควร

งานวิจัย GNMT จึงได้เริ่มต้นขึ้นด้วยการวิเคราะห์ฐานข้อมูลภาษาขนาดใหญ่ที่ Google มีอยู่ และช่วยเพิ่มความแม่นยำในการแปลให้สูงขึ้นได้เป็นอย่างมากในการนำมาใช้แปลภาษาจีน โดย GNMT จะทำการแปลงภาษาจีนให้อยู่ในรูป List ของ Vector เสียก่อน และแต่ละ Vector นั้นก็จะถูกแปลภาษาก่อนรอบหนึ่ง เรียกขั้นตอนนี้ว่า Encoder จากนั้นจึงทำการอ่านทั้งประโยค แล้วเลือกคำในภาษาอังกฤษที่ควรจะเป็นผลการแปลออกมาทีละคำด้วยการถ่วงน้ำหนักตามความสัมพันธ์ของคำใน Vector เรียกขั้นตอนนี้ว่า Decoder

ด้วยวิธีการนี้ GNMT สามารถลดความผิดพลาดในการแปลลงไปได้ 55% – 85% ในหลายๆ ภาษาจากการทดสอบกับข้อมูลบน Wikipedia และเว็บข่าวที่มีเนื้อหา 2 ภาษา ทำให้ Google ตัดสินใจนำ GNMT นี้มาใช้จริงในระบบ Production สำหรับการแปลภาษาจีนเป็นภาษาอังกฤษเลย โดย GNMT นี้ทำงานอยู่บน TensorFlow และ Tensor Processing Unit (TPU) ด้วย

สำหรับเอกสารงานวิจัยฉบับเต็ม สามารถอ่านได้ที่ http://arxiv.org/abs/1609.08144 เลยนะครับ

ที่มา: https://research.googleblog.com/2016/09/a-neural-network-for-machine.html

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

ไพรเวทอิควิตี้ Haveli ทุ่ม 1.5 พันล้านดอลลาร์ เข้าซื้อกิจการ Couchbase

บริษัทแพลตฟอร์มฐานข้อมูล NoSQL บนคลาวด์ Couchbase ประกาศว่าได้ตกลงให้บริษัทไพรเวทอิควิตี้ Haveli Investments เข้าซื้อกิจการด้วยเงินสดทั้งหมดประมาณ 1.5 พันล้านดอลลาร์

Apple คุยภายในเรื่องเข้าซื้อ Perplexity

รายงานจาก Bloomberg ระบุว่าผู้บริหารของ Apple ได้มีการหารือกันเกี่ยวกับการเข้าซื้อกิจการของ Perplexity AI อย่างไรก็ตามแหล่งข่าวกล่าวว่า การพูดคุยกันยังอยู่ในระยะเริ่มต้น และอาจไม่ได้นำไปสู่การเข้าซื้อกิจการแต่อย่างใด ทั้งนี้ Perplexity ได้รับการประเมินมูลค่าล่าสุดอยู่ที่ 14 พันล้านดอลลาร์จากการระดมทุนรอบที่ผ่านมา …