Google ผลักดันวงการ AI สำหรับวิดีโอโดยเฉพาะ ด้วยการแบ่ง Dataset ของ Video จาก YouTube ให้ใช้กันฟรีๆ ทั้งโลก
Google ได้ออกมาประกาศเปิด YouTube-8M ซึ่งเป็น Labeled Video Dataset จำนวน 8 ล้านคลิปจาก YouTube เองโดยตรง เพื่อให้นักวิจัยและธุรกิจต่างๆ สามารถนำไปใช้ในการทำ Big Data Analytics สำหรับฝึกสอน Artificial Intelligence (AI) และ Machine Learning (ML) ได้
ข้อมูลเหล่านี้จะมาในรูปไฟล์แบบ TensorFlow Record ซึ่งภายในบรรจุข้อมูล URL ของวิดีโอกว่า 8 ล้านคลิปที่มีความยาวรวมกันราวๆ 500,000 ชั่วโมง และมีภาพกว่า 1,900 ล้านเฟรม พร้อมข้อมูล Label ของ Knowledge Graph ที่จำแนกแล้วว่าแต่ละคลิปเป็นเนื้อหากลุ่มใดจากกว่า 24 กลุ่ม ทั้งนี้แต่ละคลิปก็ได้ถูกคัดสรรมาจากคลิปที่เปิดเป็น Public และมีคนดูอย่างน้อย 1,000 ครั้ง, มีความยาว 120 – 500 วินาที, ถูกจำแนกประเภทในหมวดหมู่ที่กำหนดเอาไว้ได้ และไม่มีเนื้อหาสำหรับผู้ใหญ่มาเจือปน
ผู้ที่สนใจสามารถศึกษารายละเอียดเพิ่มเติมหรือโหลด Dataset ได้ที่ https://research.google.com/youtube8m/ ทันทีนะครับ
ที่มา: https://research.googleblog.com/2016/09/announcing-youtube-8m-large-and-diverse.html