five

AIC (AI Challenger)|图像理解数据集|人工智能数据集

收藏
arXiv2017-11-17 更新2024-08-06 收录
图像理解
人工智能
下载链接:
http://arxiv.org/abs/1711.06475v1
下载链接
链接失效反馈
资源简介:
AIC (AI Challenger) 是由创新工场等机构创建的大型图像理解数据集,包含三个子数据集:人体关键点检测(HKD)、大规模属性数据集(LAD)和图像中文描述(ICC)。该数据集通过丰富的标注,如类别标签、关键点坐标、边界框、属性和描述,有效地连接了图像的低级特征与高级概念。数据集总计包含681658张图像,其中HKD包含300,000张,LAD包含81,658张,ICC包含300,000张。这些数据集不仅为评估和改进计算方法提供了有效的基准,也为相关任务提供了新的资源,特别是在人体关键点检测、属性基零样本识别和图像中文描述等领域。
提供机构:
创新工场
创建时间:
2017-11-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
AIC数据集的构建方式主要分为三个子数据集:人体关键点检测(HKD)、大规模属性数据集(LAD)和图像中文描述(ICC)。首先,设计了场景和对象类别。然后,通过网络搜索引擎查询标签名称爬取原始图像。这些图像被分为三类,即“无用”、“单对象”和“多对象”。我们仅使用单对象图像构建属性数据集,以进行零样本识别,而使用单对象和多对象图像进行关键点检测和中文描述。整个数据集包含30万个图像(带有主要角色关键点标注)用于关键点检测,81658个图像(带有标签、边界框和属性(部分))用于零样本识别,以及30万个图像,每张图像带有5个中文描述。
特点
AIC数据集的特点在于其丰富的标注,包括类标签(LAD)、关键点坐标(HKD)、边界框(HKD和LAD)、属性(LAD)和描述(ICC)。这些丰富的标注弥合了低级图像和高级概念之间的语义差距。此外,AIC数据集是第一个大规模的图像中文描述数据集,为评估和提高不同的计算方法提供了一个有效的基准。
使用方法
使用AIC数据集的方法包括将其作为三个任务的评估基准,以及作为预训练模型的新资源。对于人体关键点检测任务,可以使用训练好的深度神经网络模型进行预测。对于基于属性的零样本识别任务,可以使用标注的属性来实现零样本识别。对于图像中文描述任务,可以使用编码器-解码器框架或强化学习框架来生成描述。此外,AIC数据集还提供了基本统计数据和基线模型,以验证其有效性和初步洞察。
背景与挑战
背景概述
AIC (AI Challenger) 数据集是一项由创新工场(Sinovation Ventures)主导,北京大学(Peking University)和复旦大学(Fudan University)共同参与的大规模图像理解数据集项目。该数据集创建于2017年,旨在推动计算机视觉领域对于复杂任务的深入研究,包括人体关键点检测(HKD)、大规模属性数据集(LAD)和图像中文描述(ICC)。AIC数据集通过提供丰富的图像标注信息,如类标签、关键点坐标、边界框、属性和中文描述,有效地弥合了低级图像特征与高级概念之间的语义差距,为不同计算方法的评估和改进提供了一个有效的基准。此外,该数据集还为新模型的预训练提供了宝贵的资源。
当前挑战
AIC数据集在推动图像理解领域发展的同时,也面临着一些挑战。首先,在构建过程中,如何确保数据集的多样性和代表性是一个重要问题,特别是在人体关键点检测任务中,需要处理不同人数、不同姿态和遮挡情况下的关键点标注。其次,大规模属性数据集的构建需要大量的人工标注工作,如何保证标注质量和效率是一个挑战。此外,图像中文描述任务的挑战在于如何准确地描述图像中的多个对象及其关系,以及如何处理不同语言描述之间的差异。最后,随着图像理解任务的不断发展,如何持续更新和扩展AIC数据集,以适应新的研究需求,也是一个需要考虑的问题。
常用场景
经典使用场景
AIC数据集作为计算机视觉领域的重要资源,其经典使用场景涵盖人体关键点检测、属性基零样本识别和图像中文描述。在人体关键点检测任务中,AIC数据集提供了大量带有关键点标注的图像,有助于训练和评估人体姿态估计、动作识别等算法。属性基零样本识别则利用AIC数据集中丰富的属性标注,实现对新类别对象的识别。而图像中文描述任务则通过提供中文图像描述,推动了中文自然语言处理和计算机视觉的交叉研究。
解决学术问题
AIC数据集解决了计算机视觉领域多个关键问题。首先,它提供了大量带有丰富标注的图像,弥补了现有数据集在标注数量和种类上的不足。其次,AIC数据集的属性标注为属性基零样本识别提供了有力支持,有助于提升算法对新类别对象的识别能力。最后,AIC数据集中的中文图像描述填补了中文图像描述数据集的空白,促进了中文自然语言处理和计算机视觉的交叉研究。
衍生相关工作
AIC数据集的发布促进了相关领域的研究发展。例如,在人体关键点检测方面,基于AIC数据集的研究成果不断涌现,推动了姿态估计、动作识别等技术的进步。在属性基零样本识别方面,AIC数据集的丰富属性标注为算法研究提供了有力支持,有助于提升算法对新类别对象的识别能力。此外,AIC数据集中的中文图像描述推动了中文自然语言处理和计算机视觉的交叉研究,为相关领域的发展提供了新的思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录

LUNA16

LUNA16(肺结节分析)数据集是用于肺分割的数据集。它由 1,186 个肺结节组成,在 888 次 CT 扫描中进行了注释。

OpenDataLab 收录

Global Volcanism Program (GVP)

该数据集包含了全球火山活动的详细信息,包括火山的位置、类型、历史喷发记录、喷发频率等。数据集还提供了关于火山活动的研究报告和相关文献的链接。

volcano.si.edu 收录

YOLO-dataset

该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。

github 收录