AI ของ Google สร้างภาษากลางสากลสำเร็จ ใช้แปลภาษาด้วยหลักการและเหตุผลได้เป็นครั้งแรกของโลก

ก่อนหน้านี้ทีมวิจัย Google Brain ได้ออกมาประกาศถึงการใช้ Google Neural Machine Translation (GNMT) เพื่อใช้เรียนรู้การแปลภาษาและนำมาใช้กับ Google Translate จนกระทั่งทีมงาน Google ได้เริ่มค้นพบว่าจริงๆ แล้วในการแปลภาษาของ GNMT นี้ ระบบ AI อาจสร้างภาษากลางขึ้นมา 1 ภาษาเพื่อใช้ในการแปลทุกภาษามาเป็นภาษานี้ก่อนที่จะทำการแปลกลับออกไปเป็นภาษาที่ต้องการก็เป็นได้

คลิกเพื่อดู Animation อธิบายการทำงานของ Zero-shot Translation
คลิกเพื่อดู Animation อธิบายการทำงานของ Zero-shot Translation

 

สมมติฐานที่น่าสนใจนี้เริ่มต้นขึ้นจากการวิจัยว่า GNMT นี้จะทำการแปลคู่ภาษาใดๆ ระหว่างกันโดยที่ยังไม่เคยเรียนรู้การแปลนั้นๆ มาก่อนได้หรือไม่ ตัวอย่างเช่น GNMT อาจจะเคยแปลบางประโยคระหว่างภาษาญี่ปุ่นและอังกฤษ และเคยแปลบางประโยคระหว่างภาษาเกาหลีและอังกฤษ อย่างนี้หากจะทำการแปลระหว่างภาษาญี่ปุ่นและเกาหลีโดยตรงเลยโดยที่ไม่เคยมีตัวอย่างการแปลข้อมูลตรงๆ ล่วงหน้ามาก่อนเลย จะสามารถทำได้หรือไม่? แนวคิดลักษณะนี้คือการทำ Zero-shot Translation ที่ AI ต้องแปลภาษาด้วยการใช้หลักการและเหตุผล ไม่ใช่ตัวอย่างข้อมูลที่เคยเรียนรู้มา และทาง Google Brain Team ก็พบกับความจริงที่น่าตกใจว่า GNMT สามารถแปลภาษาในลักษณะนี้ได้

ผลลัพธ์ในการทดสอบนี้นำไปสู่ข้อสงสัยว่า หรือจริงๆ แล้ว GNMT นั้นจะสร้างภาษากลางขึ้นมาภาษาหนึ่งที่สามารถใช้ระบุความหมายสำหรับทุกๆ ภาษาและสามารถแปลงกลับไปกลับมาได้อย่างแม่นยำ หรือเรียกสั้นๆ ว่า Interlingua ทางทีมงาน Google Brain จึงได้ทำ Data Visualization แสดงการแปลงภาษาของแต่ละภาษาในประโยคต่างๆ ขึ้นมาดังนี้

google_gnmt_zero_shot_translation_02

ในส่วน a ของภาพนั้นจะเป็นการแสดงความสัมพันธ์ระหว่างการแปลข้อความจากแต่ละภาษา โดยแต่ละจุดในกราฟนั้นจะถูกกำหนดสีซึ่งแทนความหมายเอาไว้ โดยประโยคที่มีความหมายเดียวกันซึ่งถูกแปลจากภาษาอังกฤษไปเป็นเกาหลี และจากภาษาอังกฤษไปเป็นญี่ปุ่นนั้นจะมีสีเดียวกัน ส่วน b นั้นคือการซูมให้เห็นข้อมูลบางส่วนของ a ชัดเจนมากขึ้น ในขณะที่ c นั้นคือการแสดงผลโดยสีระบุถึงภาษาที่เป็นต้นฉบับในการแปล

คววามน่าสนใจอยู่ที่กราฟ c นี้เอง ที่เราจะเห็นได้ว่าในประโยคเดียวกันนั้นอาจมีภาษาต้นฉบับในการแปลได้ถึงหลายภาษา และ GNMT ก็สามารถหาความสัมพันธ์นั้นขึ้นมาได้ว่าประโยคเหล่านั้นมีความหมายเดียวกัน ดังนั้นแปลว่าตัว GNMT เองก็ต้องมีภาษากลางของมันเพื่อเอาไว้เปรียบเทียบความหมายจากการแปลประโยคในหลายภาษาที่ถูกสร้างขึ้นมาด้วยหลักการและเหตุผล ไม่ใช่การจดจำนั่นเอง

การค้นพบครั้งนี้ถือเป็นก้าวใหญ่ของวงการ Machine Learning และสำหรับนักวิจัยด้านการแปลภาษา รวมไปถึงนักภาษาศาสตร์ด้วยเช่นกัน เพราะนี่แปลว่าเราจะสามารถตีความภาษาใดๆ ในโลกให้กลับมาเป็นภาษากลางภาษาใหม่ที่ AI สร้างขึ้นมาเองได้ในอนาคต

ปัจจุบัน GNMT นี้ถูกนำมาใช้ในระบบ Google Translate อย่างเต็มตัวแล้ว และรองรับการแปลข้ามภาษาแบบอิสระได้ถึง 10 คู่ภาษาจากทั้งหมด 16 คู่ภาษาที่มีในเวลานี้ ถัดจากนี้ไปทีมงาน Google ก็จะคอยปรับปรุงให้ Google Translate มีคุณภาพมากขึ้น และปรับปรุงสถาปัตยกรรมระบบให้ซับซ้อนน้อยลงด้วย

ที่มา: https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้