Google ใช้ TensorFlow สรุปใจความจากเนื้อหาด้วย Deep Learning ได้ พร้อมเปิด Open Source แล้ว

ความสำเร็จในการใช้ Deep Learning อ่านจับใจความและสรุปเนื้อหานี้ ต่อไปจะนำไปสู่การเขียนพาดหัวข่าวสำหรับเนื้อหายาวๆ ได้โดยอัตโนมัติ

Credit: ShutterStock.com
Credit: ShutterStock.com

ทีม Google Brain เป็นทีมที่ทำงานวิจัยทางด้านการพัฒนาระบบ Machine Learning และ Deep Learning เพื่อสรุปและจับใจความของเนื้อหาข้อความด้วย Google TensorFlow โดยเฉพาะ และประสบความสำเร็จสำหรับการสรุปความจากเนื้อหาเพียงไม่กี่ประโยคในหนึ่งย่อหน้าได้แล้ว พร้อมเปิดโค้ดและชุดข้อมูลสำหรับทดสอบเอาไว้ที่ https://github.com/tensorflow/models/tree/master/textsum และ https://catalog.ldc.upenn.edu/LDC2012T21

Google ได้อธิบายถึงวิธีการสรุปใจความเอาไว้ด้วยกัน 2 แบบ โดยวิธีแรกนั้นจะใช้การตัดคำที่ไม่สำคัญจากประโยคออก ดังตัวอย่างนี้

Original Text: Alice and Bob took the train to visit the zoo. They saw a baby giraffe, a lion, and a flock of colorful tropical birds.

Extractive Summary: Alice and Bob visit the zoo. saw a flock of birds.

จะเห็นได้ว่าวิธีการตัดคำนี้อาจใช้ไม่ได้ผลกับประโยคทุกรูปแบบ และอาจมีผลลัพธ์ประหลาดๆ ที่แตกต่างจากความหมายจริงออกมาบ้าง ซึ่งถ้าให้มนุษย์เป็นคนจับใจความและสรุปความแทนควรจะได้คำตอบประมาณตัวอย่างนี้

Abstractive summary: Alice and Bob visited the zoo and saw animals and birds.

ในขณะที่อีกวิธีการหนึ่งนั้นใช้เทคโนโลยี Deep Learning มาช่วยในการสรุปความด้วยเทคนิค Sequence-to-Sequence Learning (อ่านรายละเอียดเพิ่มเติมได้ที่ http://arxiv.org/abs/1409.3215) ซึ่งเป็นเทคนิคที่คล้ายคลึงกับเทคโนโลยีที่ใช้ในการทำ Smart Reply สำหรับ Inbox ซึ่งผลลัพธ์จากการ Train ระบบ Deep Learning นี้ก็ทำให้ Google ประสบความสำเร็จในการสรุปใจความออกมาเป็นภาษามนุษย์ที่อ่านรู้เรื่อง และกลายมาเป็นพาดหัวข่าวที่ดีได้ดังนี้

Input: Article 1st sentence
Model-written headline
metro-goldwyn-mayer reported a third-quarter net loss of dlrs 16 million due mainly to the effect of accounting rules adopted this year
mgm reports 16 million net loss on higher revenue
starting from july 1, the island province of hainan in southern china will implement strict market access control on all incoming livestock and animal products to prevent the possible spread of epidemic diseases
hainan to curb spread of diseases
australian wine exports hit a record 52.1 million liters worth 260 million dollars (143 million us) in september, the government statistics office reported on monday
australian wine exports hit record high in september

ถัดจากนี้ไป Google ก็จะพยายามพัฒนาเทคโนโลยีนี้ให้รองรับข้อความที่มีขนาดยาวขึ้นไปจนถึงบทความให้ได้

ที่มา: http://research.googleblog.com/2016/08/text-summarization-with-tensorflow.html

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Google เปิดตัว Gemini 1.5 Flash-8B โมเดล AI ขนาดเล็กแบบ GA

Google ประกาศพร้อมให้บริการ Gemini 1.5 Flash-8B แบบ General Availability โมเดล AI ขนาดเล็กที่มีประสิทธิภาพสูง พร้อมเพิ่ม Rate limit 2 …

Synology เผย 4 โซลูชัน สำหรับองค์กรในงาน Synology Solution Day 2024

ในงาน Synology Solution Day 2024 ได้มีการประกาศอัปเดตความสามารถใหม่หลายรายการ โดยเนื้อหาแบ่งออกเป็นหัวข้อหลัก 4 เรื่องคือ NAS Storage, Security, Collaboration & Performance …