ImageNetデータセット

IMAGENETデータセット

ImageNetデータセットは、WordNetのsynset(類義語、同義語のようなもの)で分類された1400万枚の画像のデータセットです。

このデータセットには次の二種類のアノテーションが付与されています。

・画像の中の物体に対する画像レベルのアノテーション(画像分類)

・物体のバウンディングボックス

画像分類

Wordnetによる語彙の階層構造に基づいて分類されていて、例えば「鮭」というタグが付与された画像には「魚」というタグも付けられています。synset(類義語の対)の総数は2万に及び、それに基づいて多くの画像が分類されています。

バウンディングボックス

画像内の物体が存在するかだけでなく、存在した場合にはその正確な位置を指定しています。バウンディングボックスが付与された画像は100万ほど存在しています。

ImageNetは古くから画像認識のベンチマークとして利用されてきましたが、「Are we done with ImageNet?」という論文でその性能が再評価されています。この論文ではImageNetで分類された画像に再度新しい方法でラベリングしていて、この際のラベリングはReaL(Reassessed Labels)と呼ばれます。一つの画像に複数のラベルを付けるなど、従来のImageNetの欠点を補う形でラベリングされています。

現状のImageNetのラベルよりもReaLの方が精度を向上できる可能性があるため、ReaLを利用することも考えてもいいかもしれません。