Open Images dataset
收藏数据集概述
名称: Open Images dataset
规模: 约900万张图片
类别: 超过6000个类别
许可:
数据组织:
- 每个图片有一个唯一的64位ID。
- 数据集分为训练集(9011219张图片)和验证集(167057张图片)。
- 每张图片可能有一个或多个图像级标签。
- 训练集和验证集都有机器生成的注释,验证集还有人工注释。
标签:
- 使用Freebase或Google Knowledge Graph API中的mid格式。
- 共有7844个不同的标签,其中约6000个标签被认为是“可训练的”。
注释:
- 每个注释有一个从0.0到1.0的置信度分数。
- 人工注释为确定性(1.0或0.0),机器注释为分数,通常>=0.5。
数据文件:
- images.csv:包含图片URL、OpenImages ID、标题、作者和许可信息。
- labels.csv:将标签附加到图像ID。
数据下载:
- Image URLs and metadata (990 MB)
- Machine image-level annotations (train and validation sets) (450 MB)
- Human image-level annotations (validation set) (9 MB)
数据质量:
- 标签分布不均,某些标签关联超过一百万张图片,而其他标签关联不到100张。
- 机器注释存在噪声,但标签关联的图片越多,通常越准确。
模型训练:
- 基于Open Images注释训练了Inception v3模型,适用于微调和艺术风格转移等应用。
引用信息:
-
APA-style citation: "Krasin I., Duerig T., Alldrin N., Veit A., Abu-El-Haija S., Belongie S., Cai D., Feng Z., Ferrari V., Gomes V., Gupta A., Narayanan D., Sun C., Chechik G, Murphy K. OpenImages: A public dataset for large-scale multi-label and multi-class image classification, 2016. Available from https://github.com/openimages".
-
BibTeX:
@article{openimages, title={OpenImages: A public dataset for large-scale multi-label and multi-class image classification.}, author={Krasin, Ivan and Duerig, Tom and Alldrin, Neil and Veit, Andreas and Abu-El-Haija, Sami and Belongie, Serge and Cai, David and Feng, Zheyun and Ferrari, Vittorio and Gomes, Victor and Gupta, Abhinav, and Narayanan, Dhyanesh and Sun, Chen and Chechik, Gal and Murphy, Kevin}, journal={Dataset available from https://github.com/openimages}, year={2016} }




