AI ของ Google สร้างภาษากลางสากลสำเร็จ ใช้แปลภาษาด้วยหลักการและเหตุผลได้เป็นครั้งแรกของโลก

ก่อนหน้านี้ทีมวิจัย Google Brain ได้ออกมาประกาศถึงการใช้ Google Neural Machine Translation (GNMT) เพื่อใช้เรียนรู้การแปลภาษาและนำมาใช้กับ Google Translate จนกระทั่งทีมงาน Google ได้เริ่มค้นพบว่าจริงๆ แล้วในการแปลภาษาของ GNMT นี้ ระบบ AI อาจสร้างภาษากลางขึ้นมา 1 ภาษาเพื่อใช้ในการแปลทุกภาษามาเป็นภาษานี้ก่อนที่จะทำการแปลกลับออกไปเป็นภาษาที่ต้องการก็เป็นได้

คลิกเพื่อดู Animation อธิบายการทำงานของ Zero-shot Translation
คลิกเพื่อดู Animation อธิบายการทำงานของ Zero-shot Translation

 

สมมติฐานที่น่าสนใจนี้เริ่มต้นขึ้นจากการวิจัยว่า GNMT นี้จะทำการแปลคู่ภาษาใดๆ ระหว่างกันโดยที่ยังไม่เคยเรียนรู้การแปลนั้นๆ มาก่อนได้หรือไม่ ตัวอย่างเช่น GNMT อาจจะเคยแปลบางประโยคระหว่างภาษาญี่ปุ่นและอังกฤษ และเคยแปลบางประโยคระหว่างภาษาเกาหลีและอังกฤษ อย่างนี้หากจะทำการแปลระหว่างภาษาญี่ปุ่นและเกาหลีโดยตรงเลยโดยที่ไม่เคยมีตัวอย่างการแปลข้อมูลตรงๆ ล่วงหน้ามาก่อนเลย จะสามารถทำได้หรือไม่? แนวคิดลักษณะนี้คือการทำ Zero-shot Translation ที่ AI ต้องแปลภาษาด้วยการใช้หลักการและเหตุผล ไม่ใช่ตัวอย่างข้อมูลที่เคยเรียนรู้มา และทาง Google Brain Team ก็พบกับความจริงที่น่าตกใจว่า GNMT สามารถแปลภาษาในลักษณะนี้ได้

ผลลัพธ์ในการทดสอบนี้นำไปสู่ข้อสงสัยว่า หรือจริงๆ แล้ว GNMT นั้นจะสร้างภาษากลางขึ้นมาภาษาหนึ่งที่สามารถใช้ระบุความหมายสำหรับทุกๆ ภาษาและสามารถแปลงกลับไปกลับมาได้อย่างแม่นยำ หรือเรียกสั้นๆ ว่า Interlingua ทางทีมงาน Google Brain จึงได้ทำ Data Visualization แสดงการแปลงภาษาของแต่ละภาษาในประโยคต่างๆ ขึ้นมาดังนี้

google_gnmt_zero_shot_translation_02

ในส่วน a ของภาพนั้นจะเป็นการแสดงความสัมพันธ์ระหว่างการแปลข้อความจากแต่ละภาษา โดยแต่ละจุดในกราฟนั้นจะถูกกำหนดสีซึ่งแทนความหมายเอาไว้ โดยประโยคที่มีความหมายเดียวกันซึ่งถูกแปลจากภาษาอังกฤษไปเป็นเกาหลี และจากภาษาอังกฤษไปเป็นญี่ปุ่นนั้นจะมีสีเดียวกัน ส่วน b นั้นคือการซูมให้เห็นข้อมูลบางส่วนของ a ชัดเจนมากขึ้น ในขณะที่ c นั้นคือการแสดงผลโดยสีระบุถึงภาษาที่เป็นต้นฉบับในการแปล

คววามน่าสนใจอยู่ที่กราฟ c นี้เอง ที่เราจะเห็นได้ว่าในประโยคเดียวกันนั้นอาจมีภาษาต้นฉบับในการแปลได้ถึงหลายภาษา และ GNMT ก็สามารถหาความสัมพันธ์นั้นขึ้นมาได้ว่าประโยคเหล่านั้นมีความหมายเดียวกัน ดังนั้นแปลว่าตัว GNMT เองก็ต้องมีภาษากลางของมันเพื่อเอาไว้เปรียบเทียบความหมายจากการแปลประโยคในหลายภาษาที่ถูกสร้างขึ้นมาด้วยหลักการและเหตุผล ไม่ใช่การจดจำนั่นเอง

การค้นพบครั้งนี้ถือเป็นก้าวใหญ่ของวงการ Machine Learning และสำหรับนักวิจัยด้านการแปลภาษา รวมไปถึงนักภาษาศาสตร์ด้วยเช่นกัน เพราะนี่แปลว่าเราจะสามารถตีความภาษาใดๆ ในโลกให้กลับมาเป็นภาษากลางภาษาใหม่ที่ AI สร้างขึ้นมาเองได้ในอนาคต

ปัจจุบัน GNMT นี้ถูกนำมาใช้ในระบบ Google Translate อย่างเต็มตัวแล้ว และรองรับการแปลข้ามภาษาแบบอิสระได้ถึง 10 คู่ภาษาจากทั้งหมด 16 คู่ภาษาที่มีในเวลานี้ ถัดจากนี้ไปทีมงาน Google ก็จะคอยปรับปรุงให้ Google Translate มีคุณภาพมากขึ้น และปรับปรุงสถาปัตยกรรมระบบให้ซับซ้อนน้อยลงด้วย

ที่มา: https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

[Video] ERP for Manufacturing 2026 webinar series” โดย ProSoft และ Infor

บรรยายโดย คุณปราโมทย์ สุขศรี – Solution Consultant, Sr. Manager จาก Infor ในงานสัมมนาออนไลน์ หัวข้อ “ERP for Manufacturing …

Thaiware จัดงาน“Canva x Thaiware Enterprise Breakfast”นำเสนอ Canva Enterprise และ AI 2.0 สำหรับธุรกิจ [PR]

บริษัท ไทยแวร์ คอมมิวนิเคชั่น จำกัด (Thaiware Communication Co.,Ltd.) ผู้บริหารเว็บไซต์ Thaiware.com และผู้ให้บริการจัดจำหน่ายซอฟต์แวร์ลิขสิทธิ์ จับมือกับ Canva แพลตฟอร์ม Visual Communication …