Open Images dataset

github2017-07-20 更新2024-05-31 收录

下载链接：

https://github.com/guozhongluo/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Open Images是一个包含约900万张图片的数据集，这些图片被标注了超过6000个类别的标签。数据集分为训练集和验证集，每张图片可能有一个或多个标签，标签信息包括机器生成的和人工验证的。

Open Images is a dataset comprising approximately 9 million images, each annotated with labels spanning over 6,000 categories. The dataset is partitioned into training and validation sets, with each image potentially bearing one or multiple labels. These labels encompass both machine-generated and human-verified annotations.

创建时间：

2016-10-13

原始信息汇总

数据集概述

名称： Open Images dataset

规模： 约900万张图片

类别： 超过6000个类别

许可证：

注释： CC BY 4.0
图片： CC BY 2.0

数据组织：

ID系统： 每张图片有唯一的64位ID
数据分割： 训练集（9011219张图片）和验证集（167057张图片）
标签系统： 使用Freebase或Google Knowledge Graph API的mids
标签数量： 7844个标签，其中约6000个标签被视为可训练

数据质量：

注释类型： 机器注释和人工注释
注释准确性： 机器注释存在噪声，但标签频率越高，准确性越高

数据文件：

图像URL和元数据： 链接（880 MB）
机器图像级注释（训练和验证集）： 链接（450 MB）
人工图像级注释（验证集）： 链接（9 MB）

数据格式：

images.csv： 包含图像URL、ID、标题、作者和许可证信息
labels.csv： 将标签附加到图像ID，包含标签名称和置信度

模型应用： 已基于此数据集训练Inception v3模型，适用于Fine-tuning、DeepDream和艺术风格转移等应用。

搜集汇总

数据集介绍

构建方式

Open Images dataset 是由 Google 构建的一个大规模图像数据集，其中包含了约900万张图片的URL，并伴有超过6000个类别的标注。数据集的构建分为训练集和验证集，通过机器标注和人工验证相结合的方式，对图片进行标签标注，确保标注的准确性和多样性。

特点

该数据集的特点在于其规模宏大，标注类别丰富，且所有的标注均遵循Creative Commons Attribution许可。图片的标注信息包括机器标注的置信度，以及人工验证的明确标注结果，为研究者提供了高质量的研究素材。此外，数据集的标签采用了Freebase或Google Knowledge Graph API中的mids，便于与现有的知识图谱进行关联。

使用方法

使用该数据集时，用户可以从提供的tarball中下载图像URL和元数据、机器和人工图像级标注。数据以CSV文件的形式组织，包含图像ID、子集、原始URL、标题、作者和许可信息等。用户需自行验证图片的版权许可，并根据需求将标注信息导入PostgreSQL数据库中使用。

背景与挑战

背景概述

Open Images数据集是由Google Inc.构建并于2016年发布的一个大规模图像数据集，包含了约900万个图像URL，并附有超过6000个类别的标注。该数据集的构建旨在推进图像识别和机器学习领域的研究，为研究人员提供了一个丰富的资源，以训练和评估计算机视觉模型。Open Images数据集的影响力体现在其广泛的应用场景，包括但不限于图像分类、物体检测和图像分割等。

当前挑战

在研究领域问题方面，Open Images数据集面临的挑战包括如何提高标注的准确性和一致性，尤其是在图像标注的不均匀分布上。在构建过程中，数据集的挑战主要涉及图像版权的确认，尽管开发者在努力识别遵循Creative Commons Attribution许可的图像，但对于每张图像的版权状态，用户仍需自行验证。此外，数据集的质量控制和提高模型训练的准确性也是持续的挑战。

常用场景

经典使用场景

Open Images dataset作为计算机视觉领域的重要资源，其经典使用场景主要在于图像识别与分类任务中。研究者们通常利用其丰富的图像数据及标注信息来训练深度学习模型，从而实现对图像内容的高精度识别。

衍生相关工作

基于Open Images dataset，研究者们衍生出了众多相关工作，包括但不限于图像识别模型的改进、数据增强技术的开发以及标注质量提升方法的研究。这些工作进一步推动了计算机视觉技术的进步和普及。

数据集最近研究