Open Images Dataset
收藏github2021-04-21 更新2024-05-31 收录
下载链接:
https://github.com/cesarandreslopez/open-images-dataset-pascal-voc
下载链接
链接失效反馈官方服务:
资源简介:
Open Images是一个包含约900万个图像URL的数据集,这些图像被标注了超过6000个类别的标签。数据集分为训练、验证和测试集,图像被调整为最长边不超过1024像素,同时保持原始宽高比。
Open Images is a dataset comprising approximately 9 million image URLs, each annotated with labels from over 6,000 categories. The dataset is partitioned into training, validation, and test sets, with images resized such that the longest side does not exceed 1024 pixels while preserving the original aspect ratio.
创建时间:
2018-07-25
原始信息汇总
数据集概述
数据集名称
Open Images Dataset + VOC PASCAL annotations
数据集描述
- 规模: 约900万张图片,标注了超过6000个类别。
- 格式: 图片URLs,标注文件采用特定格式,包含图像ID、来源、标签名称、置信度、边界框坐标等信息。
数据集内容
- 图像: 分为训练集(1,743,042张)、验证集(41,620张)和测试集(125,436张)。图像最长边不超过1024像素,总大小约561GB。
- 标注: 提供VOC PASCAL格式的标注数据,包括训练集、验证集和测试集的标注文件,分别压缩后大小为198MB、4.9MB和15MB,解压后大小为5.9GB、165MB和499MB。
数据集下载
- 图像下载: 可通过AWS S3存储桶下载,支持本地目录或AWS S3存储桶。
- 标注下载: 通过wget命令下载对应的tar.gz文件。
数据集使用注意事项
- 图像和标注需匹配使用,确保边界框坐标的正确性。
- 转换为VOC PASCAL格式时,需下载所有图像以获取实际尺寸,再进行坐标转换。
数据集生成过程
- 使用class-descriptions.csv文件将MID格式类别转换为简短描述。
- 将所有相关标注按图像分组,并保存到与图像ID同名的xml文件中。
搜集汇总
数据集介绍

构建方式
Open Images Dataset 是一个包含约900万张图像URL的数据集,每张图像均标注了超过6000个类别的标签。该数据集的构建过程涉及从多个来源收集图像,并通过众包平台进行标注。标注信息包括图像中物体的边界框坐标、遮挡情况、截断情况等。为了便于使用,数据集还提供了VOC PASCAL格式的标注文件,这些文件通过将原始标注数据转换为XML格式生成,确保了与现有计算机视觉框架的兼容性。
特点
Open Images Dataset 的特点在于其规模庞大且标注丰富,涵盖了广泛的视觉类别。每个图像都包含详细的边界框标注,标注信息以归一化坐标表示,便于后续处理。此外,数据集还提供了图像的缩放版本,确保图像的最长边不超过1024像素,同时保持原始宽高比。这种处理方式不仅减少了存储和计算负担,还提高了数据处理的效率。数据集还支持多种格式的标注文件,方便用户在不同框架中使用。
使用方法
使用Open Images Dataset时,用户可以通过AWS S3云存储直接下载图像和标注文件。图像分为训练集、验证集和测试集,用户可以根据需要选择下载。标注文件以VOC PASCAL格式提供,用户可以通过简单的命令行工具下载并解压这些文件。为了确保标注与图像匹配,建议使用CVDF提供的缩放版本图像。此外,用户还可以通过提供的脚本将MID格式的类别描述转换为更易读的短描述,便于后续分析和模型训练。
背景与挑战
背景概述
Open Images Dataset是由Google于2016年推出的一个大规模图像数据集,旨在为计算机视觉领域的研究提供丰富的标注数据。该数据集包含了约900万张图像的URL,涵盖了超过6000个类别,广泛应用于图像分类、目标检测和图像分割等任务。Open Images Dataset的创建标志着图像识别领域的一个重要里程碑,其多样性和规模为深度学习模型的训练和评估提供了坚实的基础。该数据集的主要贡献者包括Google Research团队,其影响力不仅体现在学术研究中,还推动了工业界在图像识别技术上的进步。
当前挑战
Open Images Dataset在应用过程中面临的主要挑战包括数据格式转换的复杂性以及数据规模带来的计算资源需求。首先,数据集中的标注信息以归一化坐标形式存储,而许多框架(如VOC PASCAL)要求像素坐标,这需要下载所有图像并获取其尺寸信息以完成转换,这一过程耗时且资源密集。其次,数据集的规模庞大,总容量达561GB,对存储和计算资源提出了较高要求,尤其是在训练深度学习模型时。此外,数据集中部分图像的标注质量可能存在不一致性,这对模型的训练效果提出了额外的挑战。
常用场景
经典使用场景
Open Images Dataset 是一个包含约900万张图像URL的数据集,这些图像被标注了超过6000个类别的标签。该数据集广泛应用于计算机视觉领域,特别是在图像分类、目标检测和图像分割等任务中。由于其庞大的规模和丰富的标注信息,Open Images Dataset 成为了训练和验证深度学习模型的理想选择。
实际应用
在实际应用中,Open Images Dataset 被广泛用于开发智能图像识别系统,如自动驾驶、安防监控和医疗影像分析等领域。例如,自动驾驶系统可以利用该数据集中的标注信息来识别道路上的行人、车辆和交通标志,从而提高驾驶安全性。医疗领域则可以通过分析标注的医学影像,辅助医生进行疾病诊断。
衍生相关工作
Open Images Dataset 的发布催生了许多相关研究工作,特别是在目标检测和图像分割领域。基于该数据集,研究人员开发了多种先进的深度学习模型,如Faster R-CNN、Mask R-CNN等。此外,该数据集还推动了多标签分类和弱监督学习的研究进展,为计算机视觉领域的发展提供了重要支持。
以上内容由遇见数据集搜集并总结生成



