Open Images dataset

github2016-10-18 更新2024-05-31 收录

下载链接：

https://github.com/whucvliu/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Open Images是一个包含约900万张图片的数据集，这些图片被标注了超过6000个类别的标签。数据集分为训练集和验证集，每张图片可能有一个或多个标签，标签信息来源于Freebase或Google Knowledge Graph API。数据集提供了机器和人工两种标注方式，以及详细的元数据信息。

Open Images is a dataset comprising approximately 9 million images, each annotated with labels from over 6,000 categories. The dataset is divided into training and validation sets, with each image potentially bearing one or multiple labels sourced from Freebase or the Google Knowledge Graph API. It offers both machine-generated and human-annotated labels, along with comprehensive metadata.

创建时间：

2016-10-18

原始信息汇总

数据集概述

名称： Open Images dataset

大小： 约900万张图片

类别： 超过6000个类别

许可证：

注释： CC BY 4.0
图片： CC BY 2.0

数据集内容

图像信息：

ID： 每张图片有唯一的64位ID
URL： 图片的URL
元数据： 包括标题、作者、许可证信息、原始大小、MD5校验和、缩略图URL

标签信息：

类型： 机器生成和人工验证
数量： 7844个标签，其中约6000个为“可训练”标签
描述： 每个标签有短描述，可从dict.csv获取
置信度： 机器标签置信度为0.0至1.0，人工标签为确定性（1.0或0.0）

数据集组织

分割： 分为训练集（9011219张图片）和验证集（167057张图片）

文件类型：

images.csv： 包含图片的详细信息
labels.csv： 将标签与图片ID关联

数据集质量

标签分布： 高度不均匀，部分标签关联超过百万张图片，部分少于100张

准确性： 机器注释存在噪声，但标签关联的图片越多，准确性越高

数据集应用

模型训练： 基于Open Images注释训练的Inception v3模型，适用于微调和艺术风格转换等应用

搜集汇总

数据集介绍

构建方式

Open Images数据集的构建基于大规模图像URLs，并辅以丰富的标签体系。该数据集通过自动化标注与人工审核相结合的方式，确保了标注的质量与准确性。具体而言，数据集分为训练集与验证集，其中图像被赋予唯一的64位ID，并通过CSV文件形式记录图像的基本信息与标签信息。自动化标注通过机器学习模型完成，人工审核则对机器标注结果进行验证，以降低错误阳性率。

特点

Open Images数据集的特点在于其规模宏大，包含约900万张图像URLs，覆盖超过6000个类别的标签。其标注遵循Creative Commons Attribution许可，保证了数据集的开放性与可用性。此外，数据集的标签系统采用Freebase或Google Knowledge Graph API中的mids，为图像提供了详细的描述信息。标注结果的置信度评分机制，进一步提高了数据集的实用性。

使用方法

使用Open Images数据集时，用户可以根据需求下载图像URLs、元数据、机器标注与人工标注信息。数据以CSV文件格式存储，便于导入PostgreSQL等数据库进行进一步处理。用户需自行验证图像的版权状态，并遵循相应的使用许可。此外，数据集还提供了非官方的数据浏览器，方便用户直观地查看数据集内容。

背景与挑战

背景概述

Open Images数据集是由Google公司于2016年发布的一个大型图像数据集，包含约900万张图片的URL链接，这些图片被标注了超过6000个类别的标签。该数据集的创建旨在为机器学习和计算机视觉研究提供丰富的资源，尤其是在图像识别和分类领域。Open Images数据集的发布对相关领域产生了深远的影响，为研究者们提供了大量可用于训练和验证深度学习模型的标注图像。

当前挑战

Open Images数据集在构建过程中遇到的挑战主要包括图片版权的确认和标注质量的控制。尽管数据集的图片和标注都在Creative Commons许可下提供，但版权状态的核实需要用户自行完成。此外，数据集中标签分布不均，某些标签的图像数量远多于其他标签，这给模型的泛化能力带来了挑战。同时，尽管数据集提供了机器标注和人工标注，但机器标注的噪声问题以及如何进一步提高标注的准确性也是当前面临的挑战之一。

常用场景

经典使用场景

在计算机视觉研究领域，Open Images dataset以其丰富的标注图像资源，成为图像识别与分类任务中的经典数据集。研究者们通常利用其提供的图像URLs和相应的标签信息，进行深度学习模型的训练和验证，以期在图像标注的准确性上取得突破。

实际应用

在实际应用中，Open Images dataset被广泛应用于图像识别系统、自动驾驶车辆的环境感知、以及智能监控系统等。其详尽的图像标签信息，使得开发出的系统能够更加精确地理解和响应视觉信息。

衍生相关工作

基于Open Images dataset，学术界衍生出了一系列相关工作，如模型 fine-tuning、艺术风格迁移、以及DeepDream等视觉表现技术的探索，这些研究进一步拓展了计算机视觉的应用边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集