Google ประกาศแจก Dataset ชุดใหม่ภายใต้ชื่อ YouTube-BoundingBoxes ที่มีข้อมูลด้วยกันถึง 5 ล้านชุดสำหรับให้ Artificial Intelligence (AI) นำไปใช้เรียนรู้วิธีการจำแนกวัตถุจากภาพวิดีโอได้

ภายใน Dataset ชุดนี้เป็นข้อมูลจาก YouTube Video จำนวน 380,000 คลิปซึ่งมีความยาว 15-20 วินาที โดยเป็นคลิปสั้นที่ตัดออกมาจากคลิปสาธารณะบน YouTube จำนวน 240,000 คลิป โดยข้อมูลเหล่านี้ประกอบไปด้วย Bouding Box จำนวน 5.6 ล้านชุดสำหรับวัตถุ 23 หมวดหมู่ โดยแต่ละวิดีโอจะมีข้อมูล Bounding Box Annotation เป็นข้อมูลว่ามีวัตถุอะไรอยู่ที่ตรงไหนของภาพวิดีโอบ้าง เพื่อให้นำไปใช้ Train Model สำหรับจำแนกวัตถุได้อย่างแม่นยำมากยิ่งขึ้น โดย Google อ้างว่าข้อมูลชุดนี้มีความแม่นยำสูงถึง 95% เลยทีเดียว
ผู้ที่สนใจสามารถโหลดข้อมูลได้ที่ https://research.google.com/youtube-bb/ เลยครับ โดย Google มีเอกสารเสริมเกี่ยวกับ Dataset ชุดนี้ให้ได้ศึกษากันที่ https://arxiv.org/abs/1702.00824 ครับ
ที่มา: https://research.googleblog.com/2017/02/advancing-research-on-video.html