Open Images dataset

github2017-01-09 更新2024-05-31 收录

下载链接：

https://github.com/caomw/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Open Images是一个包含约900万个图像URL的数据集，这些图像被标注了超过6000个类别的标签。数据集分为训练集和验证集，每个图像可能有一个或多个标签，标签信息可通过CSV文件获取。

Open Images is a dataset comprising approximately 9 million image URLs, each annotated with labels from over 6,000 categories. The dataset is divided into training and validation sets, with each image potentially having one or multiple labels. The label information can be accessed via CSV files.

创建时间：

2016-10-01

原始信息汇总

Open Images 数据集概述

数据集描述

规模: 约900万张图片的URL。
标签: 包含超过6000个类别。
标签类型: 使用Freebase或Google Knowledge Graph API中的mids表示。
标签数量: 7844个不同的标签，其中约6000个标签被认为是可训练的。

数据集内容

图像: 每张图片有一个唯一的64位ID。
训练集: 9011219张图片。
验证集: 167057张图片。
标签分配: 每张图片可能有一个或多个图像级标签。
注释: 训练集和验证集都有机器生成的注释，验证集还有人工注释。
注释质量: 人工注释是确定的（正例1.0，负例0.0），机器注释有0.0到1.0的置信度。

数据集组织

文件类型: 包含两种CSV文件：images.csv 和 labels.csv。
images.csv: 包含图片URL、OpenImages ID、标题、作者和许可证信息。
labels.csv: 将标签与图像ID关联，每个标签附带一个置信度。

数据集下载

图像URL和元数据: 链接 (654 MB)
机器图像级注释: 链接 (330 MB)
人工图像级注释: 链接 (7 MB)

数据集质量

标签分布: 高度不均匀，某些标签关联超过一百万张图片，而其他标签关联不到100张。
注释准确性: 机器注释存在噪声，但标签关联的图片越多，准确性越高。

模型应用

已基于Open Images注释训练Inception v3模型，适用于微调应用及其他高级应用，如DeepDream和艺术风格转移。

搜集汇总

数据集介绍

构建方式

Open Images数据集的构建基于对近900万张图片的URL进行标注，这些图片覆盖了超过6000个类别。数据集分为训练集和验证集，每个图像都被分配了一个唯一的64位ID，并通过CSV文件记录了图像的URL、ID、标题、作者和许可证信息。标注采用了机器标注和人工标注相结合的方式，确保了标注的质量和准确性。

特点

该数据集的特点在于其庞大的图像数量和丰富的类别覆盖，提供了机器和人工标注两种形式，使得数据集在多样性和准确性上均有所保证。此外，每个标注都附带了一个置信度评分，有助于后续的数据分析和模型训练。数据集的标签使用Freebase或Google Knowledge Graph API中的mid表示，并提供了短描述以便转换和理解。

使用方法

用户可以通过下载提供的tarball文件来获取数据集，其中包含了图片URL和元数据的CSV文件，以及机器和人工标注的CSV文件。用户需要自行验证图片的版权许可，并根据需要将标签的mid转换为相应的短描述。该数据集适用于图像识别、标注模型训练以及相关的细粒度视觉识别研究。

背景与挑战

背景概述

Open Images数据集，由Google公司于2016年推出，旨在为图像识别领域提供一份大规模、多样化的图像资源。该数据集包含了约900万个图像URL，这些图像被标注了超过6000个类别的标签。Open Images数据集的创建，不仅丰富了图像识别研究的资源库，也为机器学习算法的训练与评估提供了重要支撑，对计算机视觉领域产生了显著影响。

当前挑战

Open Images数据集面临的挑战主要包括：1)图像标注的准确性问题，尽管数据集中大部分图像都经过了机器标注，并有一部分的标注得到了人工验证，但标注错误仍然难以完全避免，尤其是在标签分布不均匀的情况下；2)图像版权的确认问题，尽管数据集的创建者努力确保图像遵循Creative Commons Attribution许可，但由于图像来源的多样性，版权确认仍然是一个复杂且必要的步骤。

常用场景

经典使用场景

Open Images dataset作为计算机视觉领域中的一项重要资源，其经典使用场景主要集中于图像识别与分类任务。研究人员和开发者可借助该数据集训练模型，以实现对图像中物体的自动识别与标注，从而提高机器视觉理解的准确性和效率。

衍生相关工作

基于Open Images dataset，研究者们衍生出了一系列相关工作，包括但不限于图像识别模型的优化、标注算法的改进、数据增强技术的应用等。这些工作进一步推动了计算机视觉技术的发展，并为相关领域的创新提供了坚实的基础。

数据集最近研究