YouTube-BoundingBoxesデータセット
YouTube-BoundingBoxesデータセットは、24万個のYouTubeから集めた動画にそれぞれ一つのバウンディングボックスを付与したデータセットです。
編集や後処理を必要としないような動画が自動で選択されているため、自然な設定でのデータが集まっています。
バウンディングボックスは、23個のクラスに分類され、総計560万のアノテーションが付けられています。このバウンディングボックスの数は最大で、COCOやImageNetと比較しても大規模なデータセットです。
これらのアノテーションは、1フレーム1秒という細かい分類がされているほか、すべて人間が手動で付与したものであるため、精度も高くなっています。
このデータセットを利用すれば、フレームアウトしていく物体や、ぼかしが入っていて認識できない物体を推定することができます。