five

Open Images dataset|图像识别数据集|开放数据数据集

收藏
github2019-01-14 更新2024-05-31 收录
图像识别
开放数据
下载链接:
https://github.com/andreasveit/dataset
下载链接
链接失效反馈
资源简介:
Open Images是一个包含约900万张图片的数据集,这些图片被标注了超过6000个类别的标签。数据集的注释由Google Inc.根据CC BY 4.0许可进行授权。此仓库的内容根据Apache 2许可发布。数据集中的图片被标记为具有CC BY 2.0许可。

Open Images is a dataset comprising approximately 9 million images, each annotated with labels from over 6,000 categories. The annotations for this dataset are provided by Google Inc. under the CC BY 4.0 license. The contents of this repository are released under the Apache 2.0 license. The images in the dataset are marked as being under the CC BY 2.0 license.
创建时间:
2016-11-06
原始信息汇总

数据集概述

名称: Open Images dataset

规模: 约900万张图片

类别: 超过6000个类别

许可:

数据组织:

  • 每个图片有一个唯一的64位ID。
  • 数据集分为训练集(9011219张图片)和验证集(167057张图片)。
  • 每张图片可能有一个或多个图像级标签。
  • 训练集和验证集都有机器生成的注释,验证集还有人工注释。

标签:

  • 使用Freebase或Google Knowledge Graph API中的mid格式。
  • 共有7844个不同的标签,其中约6000个标签被认为是“可训练的”。

注释:

  • 每个注释有一个从0.0到1.0的置信度分数。
  • 人工注释为确定性(1.0或0.0),机器注释为分数,通常>=0.5。

数据文件:

  • images.csv:包含图片URL、OpenImages ID、标题、作者和许可信息。
  • labels.csv:将标签附加到图像ID。

数据下载:

数据质量:

  • 标签分布不均,某些标签关联超过一百万张图片,而其他标签关联不到100张。
  • 机器注释存在噪声,但标签关联的图片越多,通常越准确。

模型训练:

  • 基于Open Images注释训练了Inception v3模型,适用于微调和艺术风格转移等应用。

引用信息:

  • APA-style citation: "Krasin I., Duerig T., Alldrin N., Veit A., Abu-El-Haija S., Belongie S., Cai D., Feng Z., Ferrari V., Gomes V., Gupta A., Narayanan D., Sun C., Chechik G, Murphy K. OpenImages: A public dataset for large-scale multi-label and multi-class image classification, 2016. Available from https://github.com/openimages".

  • BibTeX:

    @article{openimages, title={OpenImages: A public dataset for large-scale multi-label and multi-class image classification.}, author={Krasin, Ivan and Duerig, Tom and Alldrin, Neil and Veit, Andreas and Abu-El-Haija, Sami and Belongie, Serge and Cai, David and Feng, Zheyun and Ferrari, Vittorio and Gomes, Victor and Gupta, Abhinav, and Narayanan, Dhyanesh and Sun, Chen and Chechik, Gal and Murphy, Kevin}, journal={Dataset available from https://github.com/openimages}, year={2016} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
Open Images数据集通过收集约900万张图像的URL,并对其进行6000多个类别的标注构建而成。该数据集的构建过程包括图像的采集、标注以及数据的分层组织。图像的标注采用了机器自动标注和人工验证相结合的方式,确保了标注的准确性和多样性。数据集被划分为训练集和验证集,分别包含9011219张和167057张图像。每张图像都分配了一个唯一的64位ID,并通过CSV文件进行管理和存储,确保了数据的可追溯性和易用性。
特点
Open Images数据集的显著特点在于其庞大的规模和丰富的类别覆盖。该数据集包含了超过6000个类别的标注,涵盖了从日常生活到专业领域的广泛主题。此外,数据集中的标注不仅包括机器生成的标签,还包含了人工验证的标签,这使得数据集在准确性和可靠性方面表现出色。数据集的标签分布不均,某些标签的图像数量超过百万,而其他标签则少于100,这种多样性为研究者提供了丰富的研究素材。
使用方法
使用Open Images数据集时,用户可以通过提供的CSV文件访问图像的URL、元数据和标注信息。数据集的下载可以通过Google Cloud Storage进行,提供了图像URL和元数据的压缩包,以及机器和人工标注的压缩包。用户还可以将标注数据导入PostgreSQL数据库,以便进行更复杂的数据分析和处理。此外,数据集还提供了预训练的Inception v3模型和BigQuery上的标注数据,方便用户进行模型训练和验证。
背景与挑战
背景概述
Open Images数据集是由Google Inc.于2016年发布的一个大规模图像数据集,包含了约900万张图像,并带有超过6000个类别的标签。该数据集的核心研究问题在于为多标签和多类图像分类提供一个丰富的资源,旨在推动计算机视觉领域的研究进展。通过结合机器生成的注释和人工验证,Open Images数据集不仅提供了高质量的标签数据,还为模型训练和评估提供了坚实的基础。其发布对图像分类、目标检测等领域的研究产生了深远影响,成为许多深度学习模型训练的重要数据来源。
当前挑战
Open Images数据集在构建过程中面临了多个挑战。首先,图像标签的分布极不均衡,某些标签关联的图像数量超过百万,而其他标签则少于100,这导致了数据集内部的类别不平衡问题。其次,机器生成的注释虽然总体准确,但仍存在噪声,尤其是在低频标签上,这增加了模型训练的难度。此外,图像的版权问题也是一个潜在的挑战,尽管数据集提供了图像的版权信息,但用户仍需自行验证每张图像的许可状态。最后,数据集的规模和复杂性使得存储、处理和分析这些数据成为一项技术挑战,尤其是在大规模训练和推理任务中。
常用场景
经典使用场景
Open Images数据集因其庞大的规模和丰富的标签类别,成为图像分类和多标签识别任务的经典数据集。研究者常利用该数据集训练深度学习模型,以提升其在多类别图像分类、目标检测和图像分割等任务中的表现。此外,该数据集还广泛应用于图像检索、视觉问答和图像生成等前沿领域,为模型提供了丰富的训练样本和多样化的视觉信息。
衍生相关工作
基于Open Images数据集,研究者们开发了多种深度学习模型和算法,推动了计算机视觉领域的技术发展。例如,基于该数据集预训练的Inception v3模型在图像分类任务中表现优异,并被广泛应用于图像生成和风格迁移等任务。此外,该数据集还激发了大量关于多标签分类、图像语义理解和跨模态学习的研究工作,为相关领域的技术进步提供了重要支持。
数据集最近研究
最新研究方向
在计算机视觉领域,Open Images数据集因其庞大的规模和丰富的多标签分类特性,成为近年来研究的热点。最新的研究方向主要集中在利用该数据集进行深度学习模型的预训练和微调,尤其是在多标签图像分类和对象检测任务中。通过引入预训练的Inception v3模型,研究者们能够更高效地进行模型迁移学习,从而在各种视觉任务中取得显著的性能提升。此外,Open Images数据集的注释数据被广泛应用于提升模型的鲁棒性和泛化能力,尤其是在处理复杂场景和多样化的视觉数据时。随着数据集质量的不断提升,未来研究将进一步探索其在自动化标注、数据增强以及跨领域应用中的潜力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

PQAref

PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。

huggingface 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录