Open Images dataset

github2019-01-14 更新2024-05-31 收录

下载链接：

https://github.com/andreasveit/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Open Images是一个包含约900万张图片的数据集，这些图片被标注了超过6000个类别的标签。数据集的注释由Google Inc.根据CC BY 4.0许可进行授权。此仓库的内容根据Apache 2许可发布。数据集中的图片被标记为具有CC BY 2.0许可。

Open Images is a dataset comprising approximately 9 million images, each annotated with labels from over 6,000 categories. The annotations for this dataset are provided by Google Inc. under the CC BY 4.0 license. The contents of this repository are released under the Apache 2.0 license. The images in the dataset are marked as being under the CC BY 2.0 license.

创建时间：

2016-11-06

原始信息汇总

数据集概述

名称： Open Images dataset

规模： 约900万张图片

类别： 超过6000个类别

许可：

注释由Google Inc.授权，使用CC BY 4.0许可。
数据集内容使用Apache 2许可。
图片标注为CC BY 2.0许可。

数据组织：

每个图片有一个唯一的64位ID。
数据集分为训练集（9011219张图片）和验证集（167057张图片）。
每张图片可能有一个或多个图像级标签。
训练集和验证集都有机器生成的注释，验证集还有人工注释。

标签：

使用Freebase或Google Knowledge Graph API中的mid格式。
共有7844个不同的标签，其中约6000个标签被认为是“可训练的”。

注释：

每个注释有一个从0.0到1.0的置信度分数。
人工注释为确定性（1.0或0.0），机器注释为分数，通常>=0.5。

数据文件：

images.csv：包含图片URL、OpenImages ID、标题、作者和许可信息。
labels.csv：将标签附加到图像ID。

数据下载：

Image URLs and metadata (990 MB)
Machine image-level annotations (train and validation sets) (450 MB)
Human image-level annotations (validation set) (9 MB)

数据质量：

标签分布不均，某些标签关联超过一百万张图片，而其他标签关联不到100张。
机器注释存在噪声，但标签关联的图片越多，通常越准确。

模型训练：

基于Open Images注释训练了Inception v3模型，适用于微调和艺术风格转移等应用。

引用信息：

APA-style citation: "Krasin I., Duerig T., Alldrin N., Veit A., Abu-El-Haija S., Belongie S., Cai D., Feng Z., Ferrari V., Gomes V., Gupta A., Narayanan D., Sun C., Chechik G, Murphy K. OpenImages: A public dataset for large-scale multi-label and multi-class image classification, 2016. Available from https://github.com/openimages".
BibTeX:

@article{openimages, title={OpenImages: A public dataset for large-scale multi-label and multi-class image classification.}, author={Krasin, Ivan and Duerig, Tom and Alldrin, Neil and Veit, Andreas and Abu-El-Haija, Sami and Belongie, Serge and Cai, David and Feng, Zheyun and Ferrari, Vittorio and Gomes, Victor and Gupta, Abhinav, and Narayanan, Dhyanesh and Sun, Chen and Chechik, Gal and Murphy, Kevin}, journal={Dataset available from https://github.com/openimages}, year={2016} }

搜集汇总

数据集介绍

构建方式

Open Images数据集通过收集约900万张图像的URL，并对其进行6000多个类别的标注构建而成。该数据集的构建过程包括图像的采集、标注以及数据的分层组织。图像的标注采用了机器自动标注和人工验证相结合的方式，确保了标注的准确性和多样性。数据集被划分为训练集和验证集，分别包含9011219张和167057张图像。每张图像都分配了一个唯一的64位ID，并通过CSV文件进行管理和存储，确保了数据的可追溯性和易用性。

特点

Open Images数据集的显著特点在于其庞大的规模和丰富的类别覆盖。该数据集包含了超过6000个类别的标注，涵盖了从日常生活到专业领域的广泛主题。此外，数据集中的标注不仅包括机器生成的标签，还包含了人工验证的标签，这使得数据集在准确性和可靠性方面表现出色。数据集的标签分布不均，某些标签的图像数量超过百万，而其他标签则少于100，这种多样性为研究者提供了丰富的研究素材。

使用方法

使用Open Images数据集时，用户可以通过提供的CSV文件访问图像的URL、元数据和标注信息。数据集的下载可以通过Google Cloud Storage进行，提供了图像URL和元数据的压缩包，以及机器和人工标注的压缩包。用户还可以将标注数据导入PostgreSQL数据库，以便进行更复杂的数据分析和处理。此外，数据集还提供了预训练的Inception v3模型和BigQuery上的标注数据，方便用户进行模型训练和验证。

背景与挑战

背景概述

Open Images数据集是由Google Inc.于2016年发布的一个大规模图像数据集，包含了约900万张图像，并带有超过6000个类别的标签。该数据集的核心研究问题在于为多标签和多类图像分类提供一个丰富的资源，旨在推动计算机视觉领域的研究进展。通过结合机器生成的注释和人工验证，Open Images数据集不仅提供了高质量的标签数据，还为模型训练和评估提供了坚实的基础。其发布对图像分类、目标检测等领域的研究产生了深远影响，成为许多深度学习模型训练的重要数据来源。

当前挑战

Open Images数据集在构建过程中面临了多个挑战。首先，图像标签的分布极不均衡，某些标签关联的图像数量超过百万，而其他标签则少于100，这导致了数据集内部的类别不平衡问题。其次，机器生成的注释虽然总体准确，但仍存在噪声，尤其是在低频标签上，这增加了模型训练的难度。此外，图像的版权问题也是一个潜在的挑战，尽管数据集提供了图像的版权信息，但用户仍需自行验证每张图像的许可状态。最后，数据集的规模和复杂性使得存储、处理和分析这些数据成为一项技术挑战，尤其是在大规模训练和推理任务中。

常用场景

经典使用场景

Open Images数据集因其庞大的规模和丰富的标签类别，成为图像分类和多标签识别任务的经典数据集。研究者常利用该数据集训练深度学习模型，以提升其在多类别图像分类、目标检测和图像分割等任务中的表现。此外，该数据集还广泛应用于图像检索、视觉问答和图像生成等前沿领域，为模型提供了丰富的训练样本和多样化的视觉信息。

衍生相关工作

基于Open Images数据集，研究者们开发了多种深度学习模型和算法，推动了计算机视觉领域的技术发展。例如，基于该数据集预训练的Inception v3模型在图像分类任务中表现优异，并被广泛应用于图像生成和风格迁移等任务。此外，该数据集还激发了大量关于多标签分类、图像语义理解和跨模态学习的研究工作，为相关领域的技术进步提供了重要支持。

数据集最近研究