ความสำเร็จในการใช้ Deep Learning อ่านจับใจความและสรุปเนื้อหานี้ ต่อไปจะนำไปสู่การเขียนพาดหัวข่าวสำหรับเนื้อหายาวๆ ได้โดยอัตโนมัติ
ทีม Google Brain เป็นทีมที่ทำงานวิจัยทางด้านการพัฒนาระบบ Machine Learning และ Deep Learning เพื่อสรุปและจับใจความของเนื้อหาข้อความด้วย Google TensorFlow โดยเฉพาะ และประสบความสำเร็จสำหรับการสรุปความจากเนื้อหาเพียงไม่กี่ประโยคในหนึ่งย่อหน้าได้แล้ว พร้อมเปิดโค้ดและชุดข้อมูลสำหรับทดสอบเอาไว้ที่ https://github.com/tensorflow/models/tree/master/textsum และ https://catalog.ldc.upenn.edu/LDC2012T21
Google ได้อธิบายถึงวิธีการสรุปใจความเอาไว้ด้วยกัน 2 แบบ โดยวิธีแรกนั้นจะใช้การตัดคำที่ไม่สำคัญจากประโยคออก ดังตัวอย่างนี้
Original Text: Alice and Bob took the train to visit the zoo. They saw a baby giraffe, a lion, and a flock of colorful tropical birds.
Extractive Summary: Alice and Bob visit the zoo. saw a flock of birds.
จะเห็นได้ว่าวิธีการตัดคำนี้อาจใช้ไม่ได้ผลกับประโยคทุกรูปแบบ และอาจมีผลลัพธ์ประหลาดๆ ที่แตกต่างจากความหมายจริงออกมาบ้าง ซึ่งถ้าให้มนุษย์เป็นคนจับใจความและสรุปความแทนควรจะได้คำตอบประมาณตัวอย่างนี้
Abstractive summary: Alice and Bob visited the zoo and saw animals and birds.
ในขณะที่อีกวิธีการหนึ่งนั้นใช้เทคโนโลยี Deep Learning มาช่วยในการสรุปความด้วยเทคนิค Sequence-to-Sequence Learning (อ่านรายละเอียดเพิ่มเติมได้ที่ http://arxiv.org/abs/1409.3215) ซึ่งเป็นเทคนิคที่คล้ายคลึงกับเทคโนโลยีที่ใช้ในการทำ Smart Reply สำหรับ Inbox ซึ่งผลลัพธ์จากการ Train ระบบ Deep Learning นี้ก็ทำให้ Google ประสบความสำเร็จในการสรุปใจความออกมาเป็นภาษามนุษย์ที่อ่านรู้เรื่อง และกลายมาเป็นพาดหัวข่าวที่ดีได้ดังนี้
Input: Article 1st sentence
|
Model-written headline
|
metro-goldwyn-mayer reported a third-quarter net loss of dlrs 16 million due mainly to the effect of accounting rules adopted this year
|
mgm reports 16 million net loss on higher revenue
|
starting from july 1, the island province of hainan in southern china will implement strict market access control on all incoming livestock and animal products to prevent the possible spread of epidemic diseases
|
hainan to curb spread of diseases
|
australian wine exports hit a record 52.1 million liters worth 260 million dollars (143 million us) in september, the government statistics office reported on monday
|
australian wine exports hit record high in september
|
ถัดจากนี้ไป Google ก็จะพยายามพัฒนาเทคโนโลยีนี้ให้รองรับข้อความที่มีขนาดยาวขึ้นไปจนถึงบทความให้ได้
ที่มา: http://research.googleblog.com/2016/08/text-summarization-with-tensorflow.html