ก่อนหน้านี้ทีมวิจัย Google Brain ได้ออกมาประกาศถึงการใช้ Google Neural Machine Translation (GNMT) เพื่อใช้เรียนรู้การแปลภาษาและนำมาใช้กับ Google Translate จนกระทั่งทีมงาน Google ได้เริ่มค้นพบว่าจริงๆ แล้วในการแปลภาษาของ GNMT นี้ ระบบ AI อาจสร้างภาษากลางขึ้นมา 1 ภาษาเพื่อใช้ในการแปลทุกภาษามาเป็นภาษานี้ก่อนที่จะทำการแปลกลับออกไปเป็นภาษาที่ต้องการก็เป็นได้

สมมติฐานที่น่าสนใจนี้เริ่มต้นขึ้นจากการวิจัยว่า GNMT นี้จะทำการแปลคู่ภาษาใดๆ ระหว่างกันโดยที่ยังไม่เคยเรียนรู้การแปลนั้นๆ มาก่อนได้หรือไม่ ตัวอย่างเช่น GNMT อาจจะเคยแปลบางประโยคระหว่างภาษาญี่ปุ่นและอังกฤษ และเคยแปลบางประโยคระหว่างภาษาเกาหลีและอังกฤษ อย่างนี้หากจะทำการแปลระหว่างภาษาญี่ปุ่นและเกาหลีโดยตรงเลยโดยที่ไม่เคยมีตัวอย่างการแปลข้อมูลตรงๆ ล่วงหน้ามาก่อนเลย จะสามารถทำได้หรือไม่? แนวคิดลักษณะนี้คือการทำ Zero-shot Translation ที่ AI ต้องแปลภาษาด้วยการใช้หลักการและเหตุผล ไม่ใช่ตัวอย่างข้อมูลที่เคยเรียนรู้มา และทาง Google Brain Team ก็พบกับความจริงที่น่าตกใจว่า GNMT สามารถแปลภาษาในลักษณะนี้ได้
ผลลัพธ์ในการทดสอบนี้นำไปสู่ข้อสงสัยว่า หรือจริงๆ แล้ว GNMT นั้นจะสร้างภาษากลางขึ้นมาภาษาหนึ่งที่สามารถใช้ระบุความหมายสำหรับทุกๆ ภาษาและสามารถแปลงกลับไปกลับมาได้อย่างแม่นยำ หรือเรียกสั้นๆ ว่า Interlingua ทางทีมงาน Google Brain จึงได้ทำ Data Visualization แสดงการแปลงภาษาของแต่ละภาษาในประโยคต่างๆ ขึ้นมาดังนี้
ในส่วน a ของภาพนั้นจะเป็นการแสดงความสัมพันธ์ระหว่างการแปลข้อความจากแต่ละภาษา โดยแต่ละจุดในกราฟนั้นจะถูกกำหนดสีซึ่งแทนความหมายเอาไว้ โดยประโยคที่มีความหมายเดียวกันซึ่งถูกแปลจากภาษาอังกฤษไปเป็นเกาหลี และจากภาษาอังกฤษไปเป็นญี่ปุ่นนั้นจะมีสีเดียวกัน ส่วน b นั้นคือการซูมให้เห็นข้อมูลบางส่วนของ a ชัดเจนมากขึ้น ในขณะที่ c นั้นคือการแสดงผลโดยสีระบุถึงภาษาที่เป็นต้นฉบับในการแปล
คววามน่าสนใจอยู่ที่กราฟ c นี้เอง ที่เราจะเห็นได้ว่าในประโยคเดียวกันนั้นอาจมีภาษาต้นฉบับในการแปลได้ถึงหลายภาษา และ GNMT ก็สามารถหาความสัมพันธ์นั้นขึ้นมาได้ว่าประโยคเหล่านั้นมีความหมายเดียวกัน ดังนั้นแปลว่าตัว GNMT เองก็ต้องมีภาษากลางของมันเพื่อเอาไว้เปรียบเทียบความหมายจากการแปลประโยคในหลายภาษาที่ถูกสร้างขึ้นมาด้วยหลักการและเหตุผล ไม่ใช่การจดจำนั่นเอง
การค้นพบครั้งนี้ถือเป็นก้าวใหญ่ของวงการ Machine Learning และสำหรับนักวิจัยด้านการแปลภาษา รวมไปถึงนักภาษาศาสตร์ด้วยเช่นกัน เพราะนี่แปลว่าเราจะสามารถตีความภาษาใดๆ ในโลกให้กลับมาเป็นภาษากลางภาษาใหม่ที่ AI สร้างขึ้นมาเองได้ในอนาคต
ปัจจุบัน GNMT นี้ถูกนำมาใช้ในระบบ Google Translate อย่างเต็มตัวแล้ว และรองรับการแปลข้ามภาษาแบบอิสระได้ถึง 10 คู่ภาษาจากทั้งหมด 16 คู่ภาษาที่มีในเวลานี้ ถัดจากนี้ไปทีมงาน Google ก็จะคอยปรับปรุงให้ Google Translate มีคุณภาพมากขึ้น และปรับปรุงสถาปัตยกรรมระบบให้ซับซ้อนน้อยลงด้วย
ที่มา: https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย







