five

BarbieGait

收藏
arXiv2026-04-14 更新2026-04-17 收录
下载链接:
https://github.com/BarbieGait/BarbieGait
下载链接
链接失效反馈
官方服务:
资源简介:
BarbieGait是由北京师范大学与阿里巴巴联合开发的合成步态识别数据集,通过虚拟引擎将真实受试者的步态特征映射至3D模型,实现身份一致性的跨服装模拟。该数据集包含521名受试者,每人100种随机服装组合(涵盖发型、上下装及配饰),生成120万条多模态序列(RGB图像、2D姿态、剪影),数据通过骨骼长度匹配、动态运动对齐等技术确保步态身份一致性。其高可控性的合成范式为跨服装步态识别研究提供了基准,旨在解决真实场景中服装多样性导致的类内方差增大问题,推动生物特征识别技术在安防监控等领域的应用。

BarbieGait is a synthetic gait recognition dataset jointly developed by Beijing Normal University and Alibaba. It maps the gait features of real subjects onto 3D models via virtual engines, enabling cross-clothing simulation with consistent identity. This dataset contains 521 subjects, each paired with 100 random clothing combinations covering hairstyles, upper/lower garments and accessories, generating 1.2 million multimodal sequences including RGB images, 2D poses and silhouettes. The data ensures consistent gait identity through techniques such as bone length matching and dynamic motion alignment. Its highly controllable synthetic paradigm provides a benchmark for cross-clothing gait recognition research, aiming to address the issue of increased intra-class variance caused by clothing diversity in real-world scenarios, and promote the application of biometric recognition technologies in fields such as security monitoring.
提供机构:
北京师范大学·人工智能学院; 阿里巴巴集团·AMAP; WATRIX.AI
创建时间:
2026-04-14
原始信息汇总

BarbieGait 数据集概述

基本信息

  • 数据集名称:BarbieGait: An Identity-Consistent Synthetic Human Dataset with Versatile Cloth-Changing for Gait Recognition
  • 相关会议:CVPR 2026
  • 作者:Qingyuan Cai, Saihui Hou, Xuecai Hu, Yongzhen Huang*
  • 机构:北京师范大学人工智能学院 · 阿里巴巴集团AMAP · WATRIX.AI
  • 项目主页:https://barbiegait.github.io/
  • 论文预印本:https://arxiv.org/abs/2604.12221

数据集简介

BarbieGait是一个身份一致、支持多样化换装的合成人体步态识别数据集。

数据获取与使用

  • 获取方式:用户需下载并签署《BarbieGaitGait Dataset Usage Agreement.pdf》协议,提交至BNU-IVC@outlook.com邮箱申请使用。
  • 处理周期:申请通常在一周内处理。
  • 数据存放路径your_path/BarbieGait_data/

数据下载与解压

  1. 从Google Drive下载数据至BarbieGait_data/目录。

  2. 执行解压命令: bash cd your_path/BarbieGait_data/ tar -xvjf BarbieGait_predsil_pkl.tar.bz2

  3. 创建符号链接至代码目录: bash cd your_path/BarbieGait_CVPR26_release/BarbieGait ln -s your_path/BarbieGait_CVPR26_release/BarbieGait_data ./BarbieGait_data

数据预处理

目录结构

BarbieGait_data/ ├── BarbieGait_predsil_pkl/ # 原始数据 (personID/clothID-seqID) ├── thick_label_by_nakeddiffnorm_eqchg/ # 衣物厚度标签 └── P2_BarbieGait_predsil_pkl/ # 输出:重组后的数据 └── {subject_id}/ └── {cloth_type}/ └── {view_id}/ `-- {view_id}.pkl

预处理步骤

执行以下命令进行数据重组: bash cd BarbieGait/datasets python create_symlnk.py

输出格式

原始文件夹名称(如cloth00-00)被重组为thick{thick_value}-{seq_in_thick}-cloth00-00格式,其中:

  • thick_value:衣物厚度类别(0-9)
  • seq_in_thick:该厚度类别内的序列索引

此重组按衣物厚度对序列进行分组,便于后续跨衣物研究。

待完成事项

  • 发布论文链接
  • 发布BarbieGait数据集
  • 发布GaitCLIF代码库
  • 发布预训练模型及配置
  • 完善文档和使用示例
搜集汇总
数据集介绍
main_image_url
构建方式
在步态识别领域,跨服装场景下的数据稀缺性长期制约着模型泛化能力的研究。BarbieGait数据集通过创新的合成数据生成范式应对这一挑战,其构建过程始于对521名真实受试者的多视角步态序列采集,并利用高精度三维姿态与网格估计技术提取个体骨骼长度与身体形态参数。随后,通过骨架长度与身体形状匹配模块,将真实受试者映射至虚拟引擎中的对应角色,确保身份一致性;随机着装模块为每个受试者生成100套涵盖发型、上下装及配饰的多样化服装组合;运动匹配模块则通过运动学对齐技术,将真实步态模式迁移至虚拟角色,保持行走动态的个体特异性。最终,在模拟多种光照与遮挡的室内外场景中,利用GPU集群进行高效渲染,生成包含RGB图像、二维姿态与轮廓的多模态数据。
特点
BarbieGait数据集的核心特征在于其身份一致性与服装多样性的高度统一。该数据集包含521名虚拟受试者,每位受试者均具有100种完全随机的全身服装变化,覆盖从轻薄夏装到厚重冬装的不同厚度级别,服装复杂度通过轮廓差异量化分为十个等级,系统性地构建了跨服装步态识别的评估体系。数据集的另一突出特点是多模态数据供给,除合成RGB图像外,还提供精确的二维人体姿态估计与分割轮廓,支持外观与姿态双流方法的探索。此外,数据集通过模拟真实世界的光照变化、视角差异与场景遮挡,增强了数据的现实性与鲁棒性,为步态识别在复杂环境下的研究提供了丰富且可控的实验基础。
使用方法
BarbieGait数据集为跨服装步态识别研究提供了系统性的评估平台。研究者可依据服装厚度分级协议,将THK0级别数据作为检索库,THK1至THK9级别作为探针集,以Rank-1准确率与平均平均精度为核心指标,量化模型在不同服装复杂度下的性能变化。数据集支持基于轮廓、RGB图像或二维姿态等多种输入模态的实验设计,并可结合提出的GaitCLIF基线模型,探索服装不变特征的学习机制。此外,数据集可作为预训练源,通过跨域迁移学习提升真实场景步态识别模型的泛化能力;其身份一致的服装变化数据亦可用于增强上游姿态估计模型的鲁棒性,形成从数据生成到下游任务的全链条研究框架。
背景与挑战
背景概述
步态识别作为一种可靠的生物识别技术,近年来发展迅速,但在实际应用中面临由多样化服装风格带来的显著挑战。BarbieGait数据集于2025年由北京师范大学、阿里巴巴集团及WATRIX.AI的研究团队联合创建,旨在通过合成数据解决跨服装步态识别中的关键问题。该数据集通过将真实受试者映射到虚拟引擎中,为每个受试者模拟100种不同的服装组合,同时保持其步态身份信息的一致性。BarbieGait不仅提供了可控的数据生成方法,还包含丰富的多模态数据(如RGB图像、2D人体姿态和轮廓),为跨服装场景下的步态识别研究奠定了坚实基础,推动了该领域在应对现实世界复杂变化方面的进展。
当前挑战
BarbieGait数据集主要应对跨服装步态识别中的两大挑战。在领域问题层面,服装多样性显著增加了同一身份内的类内差异,使得模型难以从变化的服装条件中学习到服装不变的特征,这成为步态识别在真实场景中可靠应用的核心瓶颈。在构建过程中,研究团队需克服身份一致性与服装多样性之间的平衡难题:通过骨架长度、身体形状匹配以及运动学动作匹配技术,确保虚拟角色在多种服装下仍能保留真实受试者的独特步态身份;同时,大规模服装模拟与渲染涉及高昂的计算成本与隐私考量,需借助GPU集群加速并采用合成数据以规避个人视觉信息泄露。
常用场景
经典使用场景
在步态识别领域,服装变化长期以来是影响模型性能的关键干扰因素。BarbieGait数据集通过虚拟引擎生成身份一致且服装多样的合成数据,为研究跨服装步态识别提供了标准化实验平台。该数据集最经典的使用场景是评估和提升模型在极端服装变化下的鲁棒性,研究者可利用其包含的每身份100种服装组合,系统分析不同服饰风格对步态特征提取的影响。这种可控的数据生成范式使得大规模验证跨服装问题成为可能,弥补了真实数据在服装多样性上的不足。
衍生相关工作
BarbieGait数据集催生了一系列重要的衍生研究工作。其提出的GaitCLIF基准模型通过步态导向归一化和细粒度运动保留机制,为跨服装步态识别设立了新的性能标杆。该数据集还被广泛应用于上游任务优化,如基于ViTPose的二维姿态估计模型在BarbieGait上训练后,在CCPG等真实数据集上表现出显著提升。同时,研究社区以此为基础开展了跨域泛化研究,验证了合成数据预训练对真实场景的迁移价值。这些工作共同推动了合成数据在步态识别领域的范式创新,为后续的跨视角、跨域步态研究奠定了方法论基础。
数据集最近研究
最新研究方向
步态识别作为生物特征识别领域的重要分支,近年来在应对现实世界中复杂衣着变化方面面临显著挑战。BarbieGait数据集的提出,通过身份一致的合成数据生成范式,为跨衣着步态识别研究开辟了新的前沿方向。当前研究聚焦于利用该数据集的大规模衣着多样性,探索衣着不变特征的提取与建模方法,例如通过步态导向的归一化技术消除衣着特异性统计量,并结合细粒度运动细节保留策略,提升模型在极端衣着变化下的鲁棒性。这一方向不仅推动了合成数据在步态识别中的可信度验证,也为上游姿态估计与下游身份识别任务的协同优化提供了新的实验平台,促进了步态识别在安防监控、人机交互等实际场景中的实用化进展。
相关研究论文
  • 1
    BarbieGait: An Identity-Consistent Synthetic Human Dataset with Versatile Cloth-Changing for Gait Recognition北京师范大学·人工智能学院; 阿里巴巴集团·AMAP; WATRIX.AI · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作