Richly Annotated Pedestrian (RAP) dataset
收藏arXiv2016-04-27 更新2024-06-21 收录
下载链接:
http://rap.idealtest.org/
下载链接
链接失效反馈官方服务:
资源简介:
RAP数据集是由中国科学院自动化研究所创建的大型行人属性识别数据集,包含41,585个行人样本,每个样本标注了72个属性以及视角、遮挡和身体部位信息。该数据集来源于真实的监控场景,旨在解决监控系统中行人属性识别的问题,特别是在视角、遮挡和身体部位变化下的属性识别。数据集的创建过程涉及从监控视频中提取样本,并使用高斯混合模型进行行人检测和跟踪。RAP数据集的应用领域包括监控系统中的行人分析、属性识别和多标签学习,旨在提高大规模属性识别系统的性能。
The RAP dataset is a large-scale pedestrian attribute recognition dataset developed by the Institute of Automation, Chinese Academy of Sciences. It contains 41,585 pedestrian samples, where each sample is annotated with 72 attributes, along with information about viewpoint, occlusion, and body parts. Derived from real-world surveillance scenarios, this dataset is designed to tackle the challenges of pedestrian attribute recognition in surveillance systems, particularly those involving variations in viewpoint, occlusion, and body part conditions. The construction of the RAP dataset entails extracting samples from surveillance videos and employing Gaussian Mixture Models (GMM) for pedestrian detection and tracking. Application areas of the RAP dataset include pedestrian analysis, attribute recognition, and multi-label learning in surveillance systems, with the objective of enhancing the performance of large-scale attribute recognition systems.
提供机构:
中国科学院自动化研究所
创建时间:
2016-03-23
搜集汇总
数据集介绍
构建方式
该数据集的构建方式是从真实的多摄像机监控场景中收集长期的数据,并对每个数据样本进行了精细的人类属性、视角、遮挡和身体部位信息的标注。数据集包含来自26个摄像头的41,585个人行样本,每个样本都被标注了72个属性。这些属性涵盖了描述跟踪和犯罪识别中的大多数属性。此外,还标注了视角、遮挡和身体部位等环境因素。
特点
RAP数据集的特点是拥有丰富的标注和精细的属性。它提供了比现有行人属性数据集更多的示例和属性标注,因此更适合研究行人属性识别。数据集提供了视角、遮挡、身体部位和精细属性等四种额外的标注,使得数据集更加全面和实用。此外,RAP数据集还引入了多标签学习的评估指标,如准确率、精确率、召回率和F1值,以更好地衡量属性识别的性能。
使用方法
使用RAP数据集的方法包括:首先,对数据集进行预处理,包括数据清洗、标注和特征提取等。然后,选择合适的属性识别算法,如支持向量机(SVM)或多标签卷积神经网络(CNN)模型。接着,使用数据集进行模型训练和评估。最后,根据实际应用场景,选择合适的属性识别算法和模型进行部署。在训练过程中,可以使用数据增强技术来提高模型的泛化能力。此外,还可以根据需要调整模型的参数,以获得更好的性能。
背景与挑战
背景概述
在现实监控场景中,行人属性识别的研究具有广阔的应用前景,例如用于辅助人类检测、人员再识别、人脸识别等任务。然而,适合属性识别的基准数据集的开发却相对滞后。现有的行人属性数据集通常是从不同来源收集或行人再识别数据集的整合,这种异构的收集方式给开发高质量的细粒度属性识别算法带来了挑战。此外,人类属性识别通常严重受环境或上下文因素的影响,例如视角、遮挡和身体部位,而现有的属性数据集很少关注这些因素。为了解决这些问题,我们构建了一个名为Richly Annotated Pedestrian (RAP)的数据集,该数据集来自真实的多人监控场景,并进行了长期收集。RAP数据集中的数据样本不仅标注了细粒度的人类属性,还标注了视角、遮挡、身体部位等信息。据我们所知,RAP数据集是迄今为止最大的行人属性数据集,预计将大大促进大规模属性识别系统的研究。
当前挑战
尽管RAP数据集在行人属性识别领域取得了重大进展,但仍面临一些挑战。首先,属性类别在属性识别中的内在依赖性是一个挑战。现有的评估指标,如平均准确率(mA),可能无法反映多属性学习中的这种内在依赖性。其次,RAP数据集中的样本具有高度的不平衡分布,这对于深度学习模型来说是一个挑战,因为深度学习模型通常需要大量的正类样本来进行训练。此外,视角、遮挡和身体部位等因素对属性识别的影响需要进行深入分析,以便更好地指导属性识别算法的开发。
常用场景
经典使用场景
在行人属性识别领域中,Richly Annotated Pedestrian (RAP) 数据集因其丰富的标注和大规模的样本量而成为经典。RAP 数据集包含 41,585 张行人图片,每张图片都标注了 72 个属性,包括视角、遮挡和身体部位信息。这些详细的标注使得 RAP 数据集能够用于训练高质量的细粒度属性识别算法,尤其在真实监控场景中。例如,RAP 数据集可以用于识别行人的性别、年龄、体型、角色、背包、手机等属性,这些信息对于行人检测、行人重识别、人脸识别等视觉相关任务具有重要意义。
实际应用
RAP 数据集在实际应用中具有广泛的应用前景。例如,在安全监控领域,RAP 数据集可以用于识别行人的关键属性,如性别、年龄、体型等,以便进行可疑人员的识别和追踪。此外,RAP 数据集还可以用于智能交通系统,通过识别行人的行为和状态,如打电话、聚集、交谈等,以提高交通管理的效率和安全性。此外,RAP 数据集还可以用于智能零售系统,通过识别行人的属性和购买行为,为企业提供个性化的营销策略。
衍生相关工作
RAP 数据集的出现也促进了相关经典工作的发展。例如,基于 RAP 数据集,研究者们提出了多种行人属性识别算法,如支持向量机 (SVM)、卷积神经网络 (CNN) 等。这些算法在 RAP 数据集上取得了优异的性能,并进一步推动了行人属性识别领域的研究。此外,RAP 数据集还促进了多标签学习算法的发展,如多标签 CNN 模型等。这些算法能够同时识别多个属性,并在 RAP 数据集上取得了显著的性能提升。
以上内容由遇见数据集搜集并总结生成



