CASIA-B 和 PsyMo
收藏arXiv2025-05-06 更新2025-05-13 收录
下载链接:
http://arxiv.org/abs/2505.02815v1
下载链接
链接失效反馈官方服务:
资源简介:
CASIA-B和PsyMo数据集是用于步态分析的基准数据集,CASIA-B包含124个不同个体的步态序列,从11个角度记录,而PsyMo包含312个个体的步态视频,从6个角度记录7种不同的场景。这些数据集在受控的实验室环境中收集,旨在研究步态与个体身份识别之间的关系,以及步态如何反映个体的心理特征。数据集的创建过程包括对参与者的步态进行多角度、多场景的录制,并通过预训练的步态识别模型提取步态嵌入,用于后续的步态识别和注册任务。这些数据集广泛应用于步态识别研究中,旨在解决开放集步态注册问题,即确定新的步态样本是否属于数据库中已知的身份,还是代表一个之前未见的个体。
CASIA-B and PsyMo are benchmark datasets for gait analysis. CASIA-B contains gait sequences of 124 distinct individuals, recorded from 11 viewpoints, while PsyMo includes gait videos of 312 individuals, captured across 6 viewpoints and 7 different scenarios. Both datasets are collected in controlled laboratory environments, aiming to investigate the relationship between gait and individual identity recognition, as well as how gait reflects an individual’s psychological characteristics. The dataset creation process involves multi-angle and multi-scenario recording of participants’ gaits, with gait embeddings extracted via pre-trained gait recognition models for subsequent gait recognition and enrollment tasks. These datasets are widely used in gait recognition research, targeting the open-set gait enrollment problem: determining whether a new gait sample belongs to a known identity in the database or represents a previously unseen individual.
提供机构:
布加勒斯特理工科技大学
创建时间:
2025-05-06
搜集汇总
数据集介绍

构建方式
CASIA-B和PsyMo数据集作为步态识别领域的基准数据集,其构建过程体现了高度系统化的实验设计。CASIA-B采集了124名受试者在11种视角下三种行走模式(正常、携带包裹、穿着外套)的步态序列,通过严格控制的实验室环境确保数据一致性。PsyMo则扩展了实验场景,记录312名受试者在6种视角下七种行走条件(包括变速行走和分心行走),其多模态设计融合了心理学评估维度。两个数据集均采用标准化分割策略,CASIA-B按74:50划分训练测试集,PsyMo采用250:62的官方划分,所有数据均通过专业动作捕捉系统采集并转化为骨骼关键点序列。
特点
这两个数据集的核心价值在于其精细的场景划分和丰富的元数据标注。CASIA-B通过固定视角、着装条件等变量,构建了研究视角不变性和服饰干扰的基准体系;PsyMo则创新性地引入心理特质关联标注,为多模态研究提供接口。数据集的显著特点包括:时间同步的多视角视频流、毫米级精度的3D骨骼坐标、标准化光照背景环境,以及精确到帧级的动作阶段标注。特别值得注意的是PsyMo包含的七种行走条件,模拟了真实监控场景中常见的步态变异因素,为算法鲁棒性测试提供了独特挑战。
使用方法
在使用CASIA-B和PsyMo数据集时,研究者需遵循特定的评估协议以实现可比性。对于步态识别任务,标准流程包括:使用前74/250个受试者数据训练模型,剩余50/62人用于测试;评估需涵盖所有视角组合(除相同视角外),并分别报告正常行走(NM)、携带包裹(BG)、穿着外套(CL)三种条件的准确率。对于PsyMo还需考虑七种行走场景的交叉验证。数据集提供的骨骼关键点坐标可直接输入图卷积或Transformer架构,建议采用论文中的48帧滑动窗口处理时序数据。开放集评估时,应按原始划分生成gallery-probe集,并报告ROC-AUC等指标。
背景与挑战
背景概述
CASIA-B和PsyMo是步态识别领域两个重要的数据集,由中国科学院自动化研究所和布加勒斯特理工大学等机构的研究团队分别构建。CASIA-B数据集创建于2006年,包含124名受试者在不同行走条件下的视频序列,已成为评估跨视角、跨服装步态识别算法的基准测试平台。PsyMo则是2024年发布的新型数据集,不仅采集了312名受试者的多场景步态数据,还创新性地关联了心理学特征标注。这两个数据集通过提供实验室控制环境下的标准化数据,显著推动了基于深度学习的步态表征研究,特别是在骨架关键点识别、时空特征建模等方向产生了深远影响。
当前挑战
该领域面临的核心挑战体现在算法和应用两个层面。在算法层面,跨视角和遮挡条件下的特征不变性建模仍是未完全解决的难题,现有方法对衣着变化(如外套)和携带物品(如背包)的鲁棒性仍有提升空间。在数据集构建层面,实验室环境与真实监控场景间的域差距导致模型泛化能力受限,PsyMo尝试通过心理特征关联拓展应用边界,但多模态数据的标注一致性与质量控制仍需完善。此外,开放集识别场景下的身份注册问题,即判断新样本属于已知身份还是未知个体,成为当前实际部署中的关键瓶颈,这要求算法具备动态更新知识库的能力。
常用场景
经典使用场景
CASIA-B和PsyMo数据集在步态识别领域被广泛用于开发和评估开放集步态注册方法。这些数据集通过提供多视角、多场景的步态序列,为研究者提供了丰富的实验材料。特别是在开放集识别场景中,这些数据集帮助研究者模拟真实世界中的步态识别问题,如新个体的注册和已知个体的识别。
实际应用
在实际应用中,CASIA-B和PsyMo数据集被用于开发和优化监控系统中的步态识别技术。例如,在安防领域,这些数据集帮助训练模型以识别已知嫌疑人或注册新出现的个体,从而提升监控系统的自动化和智能化水平。
衍生相关工作
基于CASIA-B和PsyMo数据集,研究者们开发了多种步态识别模型,如GaitGraph、GaitFormer和GaitPT。这些模型在骨架数据的基础上,通过不同的架构(如图卷积网络和Transformer)提取步态特征,进一步推动了步态识别技术的发展。
以上内容由遇见数据集搜集并总结生成



