StreamGait

github2025-07-26 更新2025-08-02 收录

下载链接：

https://github.com/BNU-IVC/StreamGait

下载链接

链接失效反馈

官方服务：

资源简介：

StreamGait是一个大规模、未标记的步态数据集，收集自353个YouTube直播频道，覆盖30个国家/81个城市。

StreamGait is a large-scale unlabeled gait dataset collected from 353 YouTube live channels, covering 30 countries and 81 cities.

创建时间：

2025-07-25

原始信息汇总

StreamGait数据集概述

📌 数据集简介

名称: StreamGait
类型: 大规模无标记步态数据集
来源: 353个YouTube直播频道
地理覆盖: 30个国家/81个城市

📊 核心数据特征

序列数量: 854,000条
采集方式: 固定式真实世界摄像头
环境多样性: 覆盖81个城市的环境场景

🔍 对比数据

对比维度	StreamGait	GaitLU-1M
序列数量	854 K	1.0 M
摄像头类型	固定式	手持式
城市覆盖	81个城市	16个城市

🏆 关联研究成果

MirrorGait框架在以下基准测试中的性能提升:
- Gait3D: +10.0% (达到48.1 Rank-1)
- GREW: +2.2% (达到79.6 Rank-1)
- OUMVLP-Pose: +3.4% (达到73.9 Rank-1)

📅 数据状态

[ ] 数据采集协议待发布
[ ] 训练代码和模型待发布

📬 联系方式

联系人: Shibei Meng
邮箱: mengshibei@mail.bnu.edu.cn

搜集汇总

数据集介绍

构建方式

在步态识别研究领域，StreamGait数据集的构建采用了创新的数据采集策略。该数据集通过从全球30个国家81个城市的353个YouTube直播频道中，系统性地采集了854,000个无标注步态序列。与传统的实验室环境采集不同，这些数据源自真实世界的固定摄像头场景，充分保留了自然场景下的步态多样性。数据采集过程严格遵循跨地域分布原则，确保覆盖不同文化背景下的步态特征表现。

特点

StreamGait数据集展现出显著的地域广度和场景多样性特征。其序列规模达到85万条，虽略小于GaitLU-1M的百万级数据，但在采集场景的地理分布上更具优势，覆盖城市数量达到后者的五倍。所有数据均来自真实世界的固定视角摄像头，与手持设备采集的数据相比，更能反映稳定观测条件下的步态模式。这种大规模、跨文化的无标注数据为自监督学习提供了理想的基础。

使用方法

该数据集主要服务于步态识别领域的自监督预训练研究。研究人员可基于StreamGait的海量无标注数据，开发三维姿态估计和对比学习算法。实践应用中，建议先利用该数据集进行模型预训练，再通过少量标注数据进行微调。如MirrorGait框架所示，这种模式在Gait3D等基准测试中可实现10%的性能提升。使用时需注意数据的地理分布特性，合理设计跨域泛化实验方案。

背景与挑战

背景概述

StreamGait数据集是由北京师范大学视觉计算团队于2025年推出的面向步态识别研究的大规模无标注数据集。该数据集采集自全球30个国家81个城市的353个YouTube直播频道，包含85.4万条序列，其独特价值在于首次构建了真实世界固定摄像头下的跨地域步态数据生态。作为ACM MM'25会议成果的组成部分，StreamGait与MirrorGait自监督学习框架共同推进了三维姿态估计在步态识别中的应用，在Gait3D、GREW等基准测试中实现了10%的显著性能提升，为跨视角步态分析提供了新的研究范式。

当前挑战

在领域问题层面，StreamGait致力于解决传统步态识别受限于实验室环境数据、难以泛化到真实场景的核心挑战。其无标注特性要求研究者开发更鲁棒的自监督表征学习方法，以应对真实场景中复杂的光照变化、遮挡及视角差异。在构建过程中，数据采集需克服跨国界视频版权协议协商、跨时区直播流同步等技术难题，同时需设计严格的隐私保护机制以符合多国数据合规要求。此外，如何从异构视频流中自动提取有效的步态周期，并消除直播场景特有的运动模糊与低分辨率影响，构成了数据处理环节的关键挑战。

常用场景

经典使用场景

在步态识别研究领域，StreamGait数据集以其大规模、无标签的特性成为自监督学习的理想选择。该数据集涵盖了来自30个国家81个城市的353个YouTube直播频道，提供了丰富的真实世界步态数据。研究者们可以充分利用这些数据，通过对比学习等方法，探索步态特征在不同文化背景、地理环境下的共性与差异，为跨场景步态识别奠定基础。

实际应用

在实际应用中，StreamGait数据集支撑的步态识别技术可广泛应用于安防监控、身份认证等领域。基于该数据集训练的模型能够适应不同国家和地区的步态特征，在跨境追踪、嫌疑人识别等场景中展现出强大的泛化能力。特别是在疫情防控期间，非接触式的步态识别技术因其独特的优势获得了更广泛的应用空间。

衍生相关工作

围绕StreamGait数据集，研究者们开展了一系列创新性工作。其中最具代表性的是MirrorGait框架，该框架通过将2D姿态提升至3D进行对比学习，在多个基准测试上创造了新的性能记录。此外，基于该数据集的自监督预训练方法也为GaitGraph2、SkeletonGait等模型的改进提供了重要参考，推动了整个步态识别领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集