five

AIC (AI Challenger)

收藏
arXiv2017-11-17 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1711.06475v1
下载链接
链接失效反馈
官方服务:
资源简介:
AIC (AI Challenger) 是由创新工场等机构创建的大型图像理解数据集,包含三个子数据集:人体关键点检测(HKD)、大规模属性数据集(LAD)和图像中文描述(ICC)。该数据集通过丰富的标注,如类别标签、关键点坐标、边界框、属性和描述,有效地连接了图像的低级特征与高级概念。数据集总计包含681658张图像,其中HKD包含300,000张,LAD包含81,658张,ICC包含300,000张。这些数据集不仅为评估和改进计算方法提供了有效的基准,也为相关任务提供了新的资源,特别是在人体关键点检测、属性基零样本识别和图像中文描述等领域。

AIC (AI Challenger) is a large-scale image understanding dataset created by institutions including Innovation Works. It encompasses three sub-datasets: Human Keypoint Detection (HKD), Large-scale Attribute Dataset (LAD), and Image Chinese Captioning (ICC). Rich annotations such as category labels, keypoint coordinates, bounding boxes, attributes and textual descriptions enable the dataset to effectively bridge the low-level visual features and high-level semantic concepts of images. In total, the dataset contains 681,658 images, with 300,000 in HKD, 81,658 in LAD, and 300,000 in ICC. These datasets not only provide valid benchmarks for evaluating and refining computational approaches, but also offer new resources for related tasks, especially in the fields of human keypoint detection, attribute-based zero-shot recognition, and image Chinese captioning.
提供机构:
创新工场
创建时间:
2017-11-17
搜集汇总
数据集介绍
main_image_url
构建方式
AIC数据集的构建方式主要分为三个子数据集:人体关键点检测(HKD)、大规模属性数据集(LAD)和图像中文描述(ICC)。首先,设计了场景和对象类别。然后,通过网络搜索引擎查询标签名称爬取原始图像。这些图像被分为三类,即“无用”、“单对象”和“多对象”。我们仅使用单对象图像构建属性数据集,以进行零样本识别,而使用单对象和多对象图像进行关键点检测和中文描述。整个数据集包含30万个图像(带有主要角色关键点标注)用于关键点检测,81658个图像(带有标签、边界框和属性(部分))用于零样本识别,以及30万个图像,每张图像带有5个中文描述。
特点
AIC数据集的特点在于其丰富的标注,包括类标签(LAD)、关键点坐标(HKD)、边界框(HKD和LAD)、属性(LAD)和描述(ICC)。这些丰富的标注弥合了低级图像和高级概念之间的语义差距。此外,AIC数据集是第一个大规模的图像中文描述数据集,为评估和提高不同的计算方法提供了一个有效的基准。
使用方法
使用AIC数据集的方法包括将其作为三个任务的评估基准,以及作为预训练模型的新资源。对于人体关键点检测任务,可以使用训练好的深度神经网络模型进行预测。对于基于属性的零样本识别任务,可以使用标注的属性来实现零样本识别。对于图像中文描述任务,可以使用编码器-解码器框架或强化学习框架来生成描述。此外,AIC数据集还提供了基本统计数据和基线模型,以验证其有效性和初步洞察。
背景与挑战
背景概述
AIC (AI Challenger) 数据集是一项由创新工场(Sinovation Ventures)主导,北京大学(Peking University)和复旦大学(Fudan University)共同参与的大规模图像理解数据集项目。该数据集创建于2017年,旨在推动计算机视觉领域对于复杂任务的深入研究,包括人体关键点检测(HKD)、大规模属性数据集(LAD)和图像中文描述(ICC)。AIC数据集通过提供丰富的图像标注信息,如类标签、关键点坐标、边界框、属性和中文描述,有效地弥合了低级图像特征与高级概念之间的语义差距,为不同计算方法的评估和改进提供了一个有效的基准。此外,该数据集还为新模型的预训练提供了宝贵的资源。
当前挑战
AIC数据集在推动图像理解领域发展的同时,也面临着一些挑战。首先,在构建过程中,如何确保数据集的多样性和代表性是一个重要问题,特别是在人体关键点检测任务中,需要处理不同人数、不同姿态和遮挡情况下的关键点标注。其次,大规模属性数据集的构建需要大量的人工标注工作,如何保证标注质量和效率是一个挑战。此外,图像中文描述任务的挑战在于如何准确地描述图像中的多个对象及其关系,以及如何处理不同语言描述之间的差异。最后,随着图像理解任务的不断发展,如何持续更新和扩展AIC数据集,以适应新的研究需求,也是一个需要考虑的问题。
常用场景
经典使用场景
AIC数据集作为计算机视觉领域的重要资源,其经典使用场景涵盖人体关键点检测、属性基零样本识别和图像中文描述。在人体关键点检测任务中,AIC数据集提供了大量带有关键点标注的图像,有助于训练和评估人体姿态估计、动作识别等算法。属性基零样本识别则利用AIC数据集中丰富的属性标注,实现对新类别对象的识别。而图像中文描述任务则通过提供中文图像描述,推动了中文自然语言处理和计算机视觉的交叉研究。
解决学术问题
AIC数据集解决了计算机视觉领域多个关键问题。首先,它提供了大量带有丰富标注的图像,弥补了现有数据集在标注数量和种类上的不足。其次,AIC数据集的属性标注为属性基零样本识别提供了有力支持,有助于提升算法对新类别对象的识别能力。最后,AIC数据集中的中文图像描述填补了中文图像描述数据集的空白,促进了中文自然语言处理和计算机视觉的交叉研究。
衍生相关工作
AIC数据集的发布促进了相关领域的研究发展。例如,在人体关键点检测方面,基于AIC数据集的研究成果不断涌现,推动了姿态估计、动作识别等技术的进步。在属性基零样本识别方面,AIC数据集的丰富属性标注为算法研究提供了有力支持,有助于提升算法对新类别对象的识别能力。此外,AIC数据集中的中文图像描述推动了中文自然语言处理和计算机视觉的交叉研究,为相关领域的发展提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作