Open Images Dataset V3

github2018-03-14 更新2024-05-31 收录

下载链接：

https://github.com/Ylq-127/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Open Images是一个包含约900万张图片的数据集，这些图片被标注了图像级别的标签和数千个类的边界框。

Open Images is a dataset comprising approximately 9 million images, which are annotated with image-level labels and bounding boxes for thousands of object categories.

创建时间：

2018-03-14

原始信息汇总

Open Images Dataset V3 概述

数据集描述

Open Images Dataset V3 是一个包含约900万张图片的数据集，这些图片被标注了图像级别的标签和数千个类别的边界框。

数据集内容

图像数量: 约900万张。
边界框数量: 3.7M（训练集），204,621（验证集），625,282（测试集）。
图像级别标签: 78,977,695（机器生成，训练集），512,093（机器生成，验证集），1,545,835（机器生成，测试集）；20,868,755（人类验证，训练集），551,390（人类验证，验证集），1,667,399（人类验证，测试集）。
类别数量: 19,995个图像级别类别，600个边界框级别类别。
训练可用类别: 5,000个图像级别类别，545个边界框级别类别。

数据集组织

训练集: 9,011,219张图像。
验证集: 41,620张图像。
测试集: 125,436张图像。

数据格式

数据以CSV文件格式提供，包括：

images.csv: 包含图像URL、ID、标题、作者和许可证信息。
annotations-machine.csv: 机器生成的图像级别标签。
annotations-human.csv: 人类验证的图像级别标签。
annotations-human-bbox.csv: 人类提供的带有边界框坐标的标签。

数据集特点

边界框: 所有验证和测试集的边界框均由人工标注，训练集中的边界框部分由人工标注，部分通过半自动方法生成。
图像级别标签: 训练集、验证集和测试集中的大部分图像都有人类验证的标签。
类别描述: 每个类别都有详细的描述，可通过class-descriptions.csv文件获取。

数据集下载

数据集的各个部分可以通过以下链接下载：

图像: 链接
图像URL和元数据: 链接
边界框标注: 链接
人类验证的图像级别标注: 链接
机器生成的图像级别标注: 链接
类别和类别描述: 链接

数据集使用

建议使用人类验证的标签进行模型训练，以提高准确性。同时，数据集的边界框提供了详细的物体位置信息，适用于物体检测任务。

搜集汇总

数据集介绍

构建方式

Open Images Dataset V3 是一个包含约900万张图片URL的数据集，这些图片已经被标注了图像级别的标签和边界框，涵盖了数千个类别。数据集的构建方式包括从图片中自动生成图像级别的标签，以及通过人工标注和众包验证的方式来确认这些标签，从而确保标签的准确性。对于边界框的标注，则是通过人工绘制和半自动化的方法来完成，确保了标注的精确性和效率。

特点

该数据集的特点在于其规模庞大，类别覆盖广泛，并且提供了详细的标注信息，包括图像级别的标签和边界框。此外，它还提供了可用于训练和验证的多个数据子集，以及5000个可训练的类别。数据集的标注是通过结合自动生成和人工验证的方式进行的，确保了标注的质量和多样性。

使用方法

使用该数据集的方法包括下载完整的图片数据、图像URL和元数据、标注信息等。用户可以根据需要选择不同的数据子集进行下载和使用。此外，数据集还提供了多个预训练的模型，可以帮助用户快速开始项目，并进行对象检测和图像分类等任务。

背景与挑战

背景概述

Open Images Dataset V3是由Google Inc.发布的一个包含约900万张图片的数据集，这些图片被标注了图像级别的标签和边界框，涵盖了数千个类别。该数据集的创建时间为2017年，主要研究人员来自Google。数据集的核心研究问题是提供大量标注数据以促进计算机视觉模型，特别是在物体检测和图像分类方面的研究。Open Images Dataset V3对相关领域产生了重要影响，推动了物体检测和图像识别技术的进步。

当前挑战

数据集构建过程中的挑战包括：1)确保图像标注的准确性和一致性；2)处理大量的图像数据，特别是在边界框标注方面；3)平衡不同类别的数据分布，因为某些类别的样本数量远多于其他类别；4)数据集的规模和复杂性使得模型的训练和评估变得更为困难。在解决的领域问题方面，Open Images Dataset V3面临的挑战包括：如何有效地利用这些数据来训练出能够准确识别和定位数千个不同物体的模型。

常用场景

经典使用场景

Open Images Dataset V3被广泛应用于计算机视觉领域，特别是在图像识别和目标检测任务中。其经典的使用场景包括训练深度学习模型以识别图像中的对象和场景，例如，使用卷积神经网络（CNN）进行图像分类和定位任务。

解决学术问题

该数据集解决了学术研究中关于大规模图像标注和多样化目标检测的问题，提供了丰富的图像级标签和边界框注释，有助于研究者训练和评估他们的计算机视觉模型。此外，它还解决了在图像识别中由于标签分布不均导致的模型偏差问题。

衍生相关工作

基于Open Images Dataset V3，研究者们衍生出了许多相关工作，包括开发新的目标检测算法、图像分割技术和多模态学习框架，进一步推动了计算机视觉领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集