five

Open Images dataset|图像识别数据集|计算机视觉数据集

收藏
github2016-10-01 更新2024-05-31 收录
图像识别
计算机视觉
下载链接:
https://github.com/trudger/dataset
下载链接
链接失效反馈
资源简介:
Open Images是一个包含约900万张图片的数据集,这些图片被标注了超过6000个类别的标签。该数据集由Google公司授权,使用CC BY 4.0许可证。数据集分为训练集和验证集,每张图片都有唯一的64位ID,并可能有一个或多个标签。

Open Images is a dataset comprising approximately 9 million images, each annotated with labels from over 6,000 categories. This dataset is authorized by Google and is available under the CC BY 4.0 license. It is divided into training and validation sets, with each image assigned a unique 64-bit ID and potentially one or more labels.
创建时间:
2016-10-01
原始信息汇总

Open Images 数据集概述

数据集描述

  • 规模: 约900万张图片。
  • 标签: 包含超过6000个类别。
  • 标签类型: 使用Freebase或Google Knowledge Graph API中的mid标识。
  • 标签描述: 每个标签的简短描述可在dict.csv中找到。
  • 标签数量: 共有7844个不同的标签,其中约6000个标签被认为是可训练的。

数据集组织

  • 图像ID: 每个图像有一个唯一的64位ID,以零填充的十六进制整数表示。
  • 数据分割: 分为训练集(9011219张图像)和验证集(167057张图像)。
  • 标签分配: 每张图像可能有一个或多个图像级标签。
  • 注释类型: 训练集和验证集包含机器生成的注释,验证集还包含人工注释。

数据下载

  • 图像URL和元数据: 大小654MB。
  • 机器图像级注释: 包含训练和验证集,大小330MB。
  • 人工图像级注释: 仅验证集,大小7MB。

数据文件格式

  • images.csv: 包含图像URL、OpenImages ID、标题、作者和许可证信息。
  • labels.csv: 将标签与图像ID关联,包含每个标签的置信度。

数据质量

  • 标签分布: 高度不均匀,某些标签关联超过百万张图像,而其他标签关联不到100张。
  • 注释准确性: 机器注释存在噪声,但标签关联的图像越多,通常越准确。

模型训练

  • 已基于Open Images注释训练Inception v3模型,适用于微调和艺术风格转移等应用。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Open Images数据集通过收集约900万张图像,并对其进行详尽的标注,涵盖超过6000个类别。该数据集的构建过程包括图像的采集、标注以及验证。图像来源于公开的URL,并经过机器和人工的双重标注。机器标注主要用于训练集,而验证集则包含更精确的人工标注,以确保标签的准确性。此外,每张图像都被赋予一个唯一的64位ID,并以零填充的十六进制整数形式存储。
特点
Open Images数据集的显著特点在于其庞大的规模和丰富的类别覆盖。该数据集不仅包含机器生成的标注,还特别强调了人工验证的标注,以提高数据质量。此外,数据集中的标签采用Freebase或Google Knowledge Graph API中的mids格式,确保了标签的标准化和可扩展性。数据集的标签分布不均,某些标签关联的图像数量远超其他标签,这种不均衡性为研究者提供了多样化的研究场景。
使用方法
使用Open Images数据集时,用户可以通过提供的CSV文件访问图像的URL、ID、标题、作者和许可信息。此外,labels.csv文件提供了图像的标注信息,包括标签及其置信度分数。用户可以通过dict.csv文件将mids格式的标签转换为可读的短描述。数据集的下载链接和详细的使用说明可在GitHub页面找到。该数据集适用于图像分类、目标检测等多种计算机视觉任务,尤其适合需要大规模标注数据的研究和应用。
背景与挑战
背景概述
Open Images数据集由Google Inc.创建,是一个包含约900万张图像的大型数据集,这些图像被标注了超过6000个类别。该数据集的创建旨在推动计算机视觉领域的研究,特别是图像分类和对象识别任务。通过提供丰富的图像和详细的标注,Open Images数据集为研究人员提供了一个强大的工具,以训练和验证各种机器学习模型。该数据集的标注基于Freebase和Google Knowledge Graph API中的mids,确保了标签的广泛性和准确性。自发布以来,Open Images数据集已成为计算机视觉领域的重要资源,极大地促进了相关研究的进展。
当前挑战
尽管Open Images数据集在图像分类和对象识别领域具有显著的影响力,但其构建和使用过程中仍面临诸多挑战。首先,数据集中的标签分布极不均匀,某些标签关联的图像数量超过百万,而其他标签则少于100,这种不平衡性可能导致模型训练时的偏差。其次,机器生成的标注存在一定的噪声,尽管高频标签的准确性较高,但低频标签的准确性仍有待提升。此外,数据集中的图像版权问题也是一个潜在的挑战,尽管数据集提供了图像的版权信息,但用户仍需自行验证每张图像的版权状态。这些挑战不仅影响了数据集的质量,也对基于该数据集的模型性能提出了更高的要求。
常用场景
经典使用场景
在计算机视觉领域,Open Images数据集的经典使用场景主要集中在图像分类和对象检测任务上。该数据集提供了超过900万张图像,每张图像都带有丰富的标签信息,涵盖了6000多个类别。这些标签不仅包括机器生成的注释,还有人工验证的标签,确保了数据的高质量。研究人员和工程师可以利用这些数据进行深度学习模型的训练和验证,特别是在需要大量标注数据的情况下,Open Images数据集提供了宝贵的资源。
解决学术问题
Open Images数据集在学术研究中解决了多个关键问题。首先,它为图像分类和对象检测提供了大规模、多样化的数据支持,有助于提升模型的泛化能力和准确性。其次,通过提供机器和人工双重验证的标签,该数据集帮助研究人员评估和改进模型的鲁棒性。此外,Open Images数据集还促进了跨领域的研究,如图像检索、图像生成和视觉问答等,推动了计算机视觉领域的整体进步。
衍生相关工作
基于Open Images数据集,许多相关的经典工作得以展开。例如,研究人员利用该数据集训练了多种深度学习模型,如Inception v3,这些模型在图像分类和对象检测任务中表现出色。此外,Open Images数据集还激发了关于数据增强和模型鲁棒性研究的新思路。在艺术领域,该数据集也被用于生成艺术作品,如DeepDream和风格迁移,展示了其在非传统应用中的创新潜力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录