Open Images dataset

github2016-10-01 更新2024-05-31 收录

下载链接：

https://github.com/trudger/dataset

下载链接

链接失效反馈

资源简介：

Open Images是一个包含约900万张图片的数据集，这些图片被标注了超过6000个类别的标签。该数据集由Google公司授权，使用CC BY 4.0许可证。数据集分为训练集和验证集，每张图片都有唯一的64位ID，并可能有一个或多个标签。

Open Images is a dataset comprising approximately 9 million images, each annotated with labels from over 6,000 categories. This dataset is authorized by Google and is available under the CC BY 4.0 license. It is divided into training and validation sets, with each image assigned a unique 64-bit ID and potentially one or more labels.

创建时间：

2016-10-01

原始信息汇总

Open Images 数据集概述

数据集描述

规模: 约900万张图片。
标签: 包含超过6000个类别。
标签类型: 使用Freebase或Google Knowledge Graph API中的mid标识。
标签描述: 每个标签的简短描述可在dict.csv中找到。
标签数量: 共有7844个不同的标签，其中约6000个标签被认为是可训练的。

数据集组织

图像ID: 每个图像有一个唯一的64位ID，以零填充的十六进制整数表示。
数据分割: 分为训练集（9011219张图像）和验证集（167057张图像）。
标签分配: 每张图像可能有一个或多个图像级标签。
注释类型: 训练集和验证集包含机器生成的注释，验证集还包含人工注释。

数据下载

图像URL和元数据: 大小654MB。
机器图像级注释: 包含训练和验证集，大小330MB。
人工图像级注释: 仅验证集，大小7MB。

数据文件格式

images.csv: 包含图像URL、OpenImages ID、标题、作者和许可证信息。
labels.csv: 将标签与图像ID关联，包含每个标签的置信度。

数据质量

标签分布: 高度不均匀，某些标签关联超过百万张图像，而其他标签关联不到100张。
注释准确性: 机器注释存在噪声，但标签关联的图像越多，通常越准确。

模型训练

已基于Open Images注释训练Inception v3模型，适用于微调和艺术风格转移等应用。

搜集汇总

数据集介绍

构建方式

Open Images数据集通过收集约900万张图像，并对其进行详尽的标注，涵盖超过6000个类别。该数据集的构建过程包括图像的采集、标注以及验证。图像来源于公开的URL，并经过机器和人工的双重标注。机器标注主要用于训练集，而验证集则包含更精确的人工标注，以确保标签的准确性。此外，每张图像都被赋予一个唯一的64位ID，并以零填充的十六进制整数形式存储。

特点

Open Images数据集的显著特点在于其庞大的规模和丰富的类别覆盖。该数据集不仅包含机器生成的标注，还特别强调了人工验证的标注，以提高数据质量。此外，数据集中的标签采用Freebase或Google Knowledge Graph API中的mids格式，确保了标签的标准化和可扩展性。数据集的标签分布不均，某些标签关联的图像数量远超其他标签，这种不均衡性为研究者提供了多样化的研究场景。

使用方法

使用Open Images数据集时，用户可以通过提供的CSV文件访问图像的URL、ID、标题、作者和许可信息。此外，labels.csv文件提供了图像的标注信息，包括标签及其置信度分数。用户可以通过dict.csv文件将mids格式的标签转换为可读的短描述。数据集的下载链接和详细的使用说明可在GitHub页面找到。该数据集适用于图像分类、目标检测等多种计算机视觉任务，尤其适合需要大规模标注数据的研究和应用。

背景与挑战

背景概述

Open Images数据集由Google Inc.创建，是一个包含约900万张图像的大型数据集，这些图像被标注了超过6000个类别。该数据集的创建旨在推动计算机视觉领域的研究，特别是图像分类和对象识别任务。通过提供丰富的图像和详细的标注，Open Images数据集为研究人员提供了一个强大的工具，以训练和验证各种机器学习模型。该数据集的标注基于Freebase和Google Knowledge Graph API中的mids，确保了标签的广泛性和准确性。自发布以来，Open Images数据集已成为计算机视觉领域的重要资源，极大地促进了相关研究的进展。

当前挑战

尽管Open Images数据集在图像分类和对象识别领域具有显著的影响力，但其构建和使用过程中仍面临诸多挑战。首先，数据集中的标签分布极不均匀，某些标签关联的图像数量超过百万，而其他标签则少于100，这种不平衡性可能导致模型训练时的偏差。其次，机器生成的标注存在一定的噪声，尽管高频标签的准确性较高，但低频标签的准确性仍有待提升。此外，数据集中的图像版权问题也是一个潜在的挑战，尽管数据集提供了图像的版权信息，但用户仍需自行验证每张图像的版权状态。这些挑战不仅影响了数据集的质量，也对基于该数据集的模型性能提出了更高的要求。

常用场景

经典使用场景

在计算机视觉领域，Open Images数据集的经典使用场景主要集中在图像分类和对象检测任务上。该数据集提供了超过900万张图像，每张图像都带有丰富的标签信息，涵盖了6000多个类别。这些标签不仅包括机器生成的注释，还有人工验证的标签，确保了数据的高质量。研究人员和工程师可以利用这些数据进行深度学习模型的训练和验证，特别是在需要大量标注数据的情况下，Open Images数据集提供了宝贵的资源。

解决学术问题

Open Images数据集在学术研究中解决了多个关键问题。首先，它为图像分类和对象检测提供了大规模、多样化的数据支持，有助于提升模型的泛化能力和准确性。其次，通过提供机器和人工双重验证的标签，该数据集帮助研究人员评估和改进模型的鲁棒性。此外，Open Images数据集还促进了跨领域的研究，如图像检索、图像生成和视觉问答等，推动了计算机视觉领域的整体进步。

衍生相关工作

基于Open Images数据集，许多相关的经典工作得以展开。例如，研究人员利用该数据集训练了多种深度学习模型，如Inception v3，这些模型在图像分类和对象检测任务中表现出色。此外，Open Images数据集还激发了关于数据增强和模型鲁棒性研究的新思路。在艺术领域，该数据集也被用于生成艺术作品，如DeepDream和风格迁移，展示了其在非传统应用中的创新潜力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集