PETAzs, RAPv2zs

Name: PETAzs, RAPv2zs
Creator: 中国科学院自动化研究所
Published: 2020-05-26 09:13:23
License: 暂无描述

arXiv2020-05-26 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2005.11909v2

下载链接

链接失效反馈

官方服务：

资源简介：

PETAzs和RAPv2zs是基于PETA和RAPv2数据集构建的两个现实场景数据集，旨在解决现有数据集中训练集和测试集身份重叠的问题。这两个数据集遵循零样本设置，确保测试集中的行人身份与训练集完全不重叠，从而更真实地反映实际应用场景。数据集的创建过程涉及对原始数据集的重新划分，以消除身份重叠，提高数据集的实用性和评估的准确性。这些数据集主要应用于行人属性识别领域，旨在解决行人属性识别模型在实际应用中的性能评估问题。

PETAzs and RAPv2zs are two real-world datasets constructed based on the PETA and RAPv2 datasets, designed to resolve the identity overlap issue between training and test sets in existing datasets. These two datasets adopt the zero-shot setting, ensuring that all pedestrian identities in the test set have no overlap with those in the training set, thus more realistically reflecting real-world application scenarios. The creation of these datasets entails re-partitioning the original datasets to eliminate identity overlap, thereby enhancing the practicality of the datasets and the accuracy of evaluation. These datasets are primarily applied in the field of pedestrian attribute recognition, aiming to solve the performance evaluation problems of pedestrian attribute recognition models in practical applications.

提供机构：

中国科学院自动化研究所

创建时间：

2020-05-25

搜集汇总

数据集介绍

构建方式

在行人属性识别领域，现有数据集常因训练集与测试集存在大量相同行人身份而导致模型评估失真。为构建更符合实际应用场景的数据集，PETAzs与RAPv2zs基于PETA和RAPv2数据集，采用行人身份零样本划分策略。具体构建过程遵循五项严格准则：确保训练集、验证集与测试集的行人身份完全互斥，同时控制各集合间图像数量、属性正样本比例的差异在预设阈值内。通过身份标签的精细重组，实现了数据分布的合理重构，有效消除了身份重叠带来的数据泄漏问题。

特点

PETAzs与RAPv2zs的核心特点在于其高度现实性与评估严谨性。数据集彻底分离了训练与测试阶段的行人身份，模拟了真实监控场景中未见身份的行人属性识别需求。这一设计显著降低了模型对已知身份特征的依赖，迫使算法学习更具泛化能力的属性表征。数据集中属性标注涵盖年龄、性别、服饰等多维度语义信息，且通过平衡正负样本分布缓解了属性不均衡问题。与原始数据集相比，新数据集在测试集上完全消除了身份重叠图像，为模型性能提供了更可靠、无偏的评估基准。

使用方法

使用PETAzs与RAPv2zs时，需遵循行人属性识别的标准多标签分类流程。研究者可采用ResNet50等骨干网络提取特征，并搭配线性分类器与Sigmoid函数进行属性预测。训练中建议使用加权交叉熵损失函数，以应对属性间的样本分布差异。数据预处理包括图像缩放、随机水平翻转等增强操作。评估指标涵盖标签层面的平均准确率（mA）及实例层面的准确率、精确率、召回率与F1分数。数据集支持端到端训练，可用于验证模型在零样本身份设定下的泛化能力，尤其适合检验算法对未知行人属性的识别鲁棒性。

背景与挑战

背景概述

在计算机视觉领域，行人属性识别作为视频监控中的关键任务，旨在从行人图像中预测年龄、性别、衣着等多重语义属性，广泛应用于行人检索与重识别等实际场景。随着深度学习技术的推进，该领域的研究取得了显著进展，然而现有数据集如PETA和RAPv2在构建时普遍采用随机划分策略，导致训练集与测试集中存在大量相同行人身份的图像，这与现实应用中测试集身份通常未知的情境相悖，从而高估了模型性能。为应对这一局限，中国科学院自动化研究所的研究团队于2020年提出了PETAzs和RAPv2zs数据集，基于零样本身份设置重构数据划分，旨在提供更符合实际应用的评估基准，推动行人属性识别研究向更严谨、实用的方向发展。

当前挑战

行人属性识别领域面临的核心挑战在于如何设计能够准确反映现实场景复杂性的数据集，以提升模型的泛化能力。具体而言，现有数据集中训练集与测试集的身份重叠问题导致模型在测试时过度依赖已见身份的特征，难以应对未知身份的图像，从而在真实应用中表现不佳。此外，在数据集构建过程中，需确保身份分布的完全分离，同时维持属性样本的平衡性，避免因划分不当引入偏差。PETAzs和RAPv2zs的创建正是为了应对这些挑战，通过严格遵循零样本身份准则，重新划分数据以消除身份泄漏，但这也对模型的特征学习能力提出了更高要求，促使研究者探索更鲁棒的算法以在真实场景中实现稳定性能。

常用场景

经典使用场景

在行人属性识别领域，PETAzs和RAPv2zs数据集最经典的使用场景在于为模型评估提供零样本身份划分的基准测试环境。这些数据集通过严格分离训练集与测试集中的行人身份，模拟了现实监控场景中未见身份识别的挑战，从而成为验证算法泛化能力的黄金标准。研究者通常利用这些数据集进行多标签分类模型的训练与测试，评估模型在跨身份场景下对年龄、性别、服饰等语义属性的识别精度，为行人分析技术的演进提供了可靠的实验平台。

实际应用

在实际应用层面，这些数据集支撑着智能视频监控系统的关键技术研发。基于零样本身份划分的数据结构，训练出的模型能够有效应对城市安防、交通管理等场景中行人身份动态变化的挑战。系统可实现对未见行人的属性实时分析，为人员检索、行为分析、异常检测等任务提供精准的语义描述，显著提升了大规模监控网络中行人理解技术的实用性与可靠性。

衍生相关工作

该数据集的推出催生了一系列关注模型泛化能力的研究工作。许多后续研究以此为基础，探索了基于元学习的跨身份适应方法、属性间语义关系建模技术，以及针对长尾属性分布的平衡学习策略。同时，这些数据集也促进了行人重识别与属性识别任务的协同研究，衍生出多任务学习框架和跨模态融合方法，推动了行人分析技术向更精细、更鲁棒的方向发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集