ครบรอบ 10 ปี Google Translate; Google เผยงานวิจัย AI แปลภาษาใหม่ ใช้ในการแปลจีนเป็นอังกฤษแล้ว

เมื่อวันที่ 27 กันยายน 2016 ที่ผ่านมา เป็นวันครบรอบ 10 ปีของบริการ Google Translate และทาง Google ก็ถือเอาโอกาสนี้มาใช้ในการเปิดตัวเทคโนโลยี Google Neural Machine Translation (GNMT) สำหรับการแปลภาษาแบบใหม่ ที่เริ่มใช้จริงภายในการแปลภาษาจีนมาเป็นอังกฤษทั้งหมดแล้ว

google_gnmt

ไม่กี่ปีก่อนหน้านี้ Google ได้เริ่มใช้ Recurrent Neural Networks (RNNs) ในการเรียนรู้ Input และ Output ในแต่ละการแปลโดยตรง เพื่อนำมาใช้ในการแปลภาษาด้วยวิธีการ Neural Machine Translation (NMT) ที่พิจารณาข้อความทั้งหมดที่จะนำมาแปลเลย ต่างจากวิธีการเดิมๆ อย่าง Phrase-based Machine Translation (PBMT) ที่ต้องตัดข้อความออกเป็นคำหรือประโยคก่อนที่จะแปล โดยแรกเริ่มที่ทดสอบนั้น NMT สามารถให้ความแม่นยำได้เทียบเท่ากับ PBMT เลย

จากนั้นทีมนักวิจัยจาก Google ก็ได้ทำการปรับปรุงรูปแบบการแปล เช่น เพิ่มการจัดการกับคำที่ไม่ค่อยได้พบบ่อย, ปรับแต่งวิธีการเรียบเรียงคำใน Input และ Output และอื่นๆ แต่อย่างไรก็ดีความแม่นยำในการแปลก็ยังไม่ได้เพิ่มขึ้นสูงมากเท่าที่ควร

งานวิจัย GNMT จึงได้เริ่มต้นขึ้นด้วยการวิเคราะห์ฐานข้อมูลภาษาขนาดใหญ่ที่ Google มีอยู่ และช่วยเพิ่มความแม่นยำในการแปลให้สูงขึ้นได้เป็นอย่างมากในการนำมาใช้แปลภาษาจีน โดย GNMT จะทำการแปลงภาษาจีนให้อยู่ในรูป List ของ Vector เสียก่อน และแต่ละ Vector นั้นก็จะถูกแปลภาษาก่อนรอบหนึ่ง เรียกขั้นตอนนี้ว่า Encoder จากนั้นจึงทำการอ่านทั้งประโยค แล้วเลือกคำในภาษาอังกฤษที่ควรจะเป็นผลการแปลออกมาทีละคำด้วยการถ่วงน้ำหนักตามความสัมพันธ์ของคำใน Vector เรียกขั้นตอนนี้ว่า Decoder

ด้วยวิธีการนี้ GNMT สามารถลดความผิดพลาดในการแปลลงไปได้ 55% – 85% ในหลายๆ ภาษาจากการทดสอบกับข้อมูลบน Wikipedia และเว็บข่าวที่มีเนื้อหา 2 ภาษา ทำให้ Google ตัดสินใจนำ GNMT นี้มาใช้จริงในระบบ Production สำหรับการแปลภาษาจีนเป็นภาษาอังกฤษเลย โดย GNMT นี้ทำงานอยู่บน TensorFlow และ Tensor Processing Unit (TPU) ด้วย

สำหรับเอกสารงานวิจัยฉบับเต็ม สามารถอ่านได้ที่ http://arxiv.org/abs/1609.08144 เลยนะครับ

ที่มา: https://research.googleblog.com/2016/09/a-neural-network-for-machine.html


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

แนะนำ AMD EPYC Server: อีกทางเลือกหนึ่งที่อาจช่วยลดค่าใช้จ่ายใน Data Center ขององค์กรได้อย่างคาดไม่ถึง

ท่ามกลางยุคแห่งการทำ Digital Transformation นี้ ยอดขายของ Server ทั่วโลกนั้นก็เติบโตขึ้นเป็นลำดับสอดคล้องกับความต้องการในการประมวลผลที่สูงขึ้นอย่างรวดเร็ว AMD ในฐานะของผู้พัฒนาเทคโนโลยีด้านการประมวลผลระดับโลก จึงได้นำเสนอ AMD EPYC หน่วยประมวลผลสำหรับ Server ที่ออกแบบด้วยแนวคิดต่างจาก x86 CPU ค่ายอื่นๆ เพื่อให้เหล่าธุรกิจองค์กรได้มีทางเลือกใหม่ที่คุ้มค่าในการลงทุน บทความนี้จะนำทุกท่านไปรู้จักกับ AMD EPYC Server สำหรับการใช้งานภายใน Data Center ของธุรกิจองค์กรโดยเฉพาะกันครับ

รายงานชี้มีช่องโหว่ 5.5% เท่านั้นที่ถูกใช้งานจริง

มีงานวิจัยที่ศึกษาถึงช่องโหว่ที่ถูกเปิดเผยระหว่างปี 2009 – 2018 ซึ่งพบว่าจากช่องโหว่ที่มีการค้นพบกว่า 76,000 รายการมีเพียง 4,183 รายการ เท่านั้นที่ถูกนำมาใช้จริงในการโจมตี