CrowdTrack

Name: CrowdTrack
Creator: 复旦大学
Published: 2025-07-03 17:36:44
License: 暂无描述

arXiv2025-07-03 更新2025-07-05 收录

下载链接：

https://github.com/loseevaya/CrowdTrack

下载链接

链接失效反馈

官方服务：

资源简介：

CrowdTrack 是一个大规模的多行人跟踪数据集，包含33个视频序列，约4万张图像帧，以及超过70万个行人标注。该数据集旨在解决现实世界跟踪场景中的关键问题，涵盖了各种复杂的场景，如人群密集、遮挡和模糊等，为算法研究提供了丰富的训练信号，以提高模型在现实世界复杂性下的鲁棒性。数据集包含了多样化的相机设置，包括移动和固定镜头拍摄，所有数据均来自无约束的日常生活环境，确保了行人行为的自然性，从而增强了数据集在实际应用中的相关性，如机器人技术和自动驾驶。

CrowdTrack is a large-scale multi-person tracking dataset containing 33 video sequences, approximately 40,000 image frames, and over 700,000 pedestrian annotations. This dataset aims to address key challenges in real-world tracking scenarios, covering various complex situations such as dense crowds, occlusions, and motion blurs. It provides abundant training signals for algorithm research to improve the robustness of models against real-world complexities. The dataset includes diverse camera configurations, with both mobile and fixed-lens captures. All data are collected from unconstrained daily-life environments, ensuring the naturalness of pedestrian behaviors, thereby enhancing the practical relevance of the dataset for applications such as robotics and autonomous driving.

提供机构：

复旦大学

创建时间：

2025-07-03

原始信息汇总

CrowdTrack数据集概述

数据集基本信息

官方仓库：CrowdTrack数据集是论文《CrowdTrack: A Benchmark for Difficult Multiple Pedestrian Tracking in Real Scenarios》的官方数据集。
数据集地址：Baidu Cloud
密码：crtr

数据集内容

场景分布：包含场景分布的可视化图表（见assets/changjing.png）。
统计特征：包含数据集的统计特征可视化图表（见assets/tongji.png）。

排行榜

排行榜信息：包含排行榜的可视化图表（见assets/leaderboard.png）。

搜集汇总

数据集介绍

构建方式

CrowdTrack数据集的构建过程体现了严谨的科学态度与对现实场景的高度还原。研究团队从真实环境中采集了33段视频序列，涵盖购物中心、建筑工地、地下车站等多种复杂场景，确保数据具有自然的行为模式和真实的遮挡情况。所有视频均经过严格的隐私处理，采用专业标注团队进行三轮质量校验，标注标准遵循MOT领域惯例——仅标注可见人体实例，并为每个轨迹分配唯一ID。特别值得注意的是，该数据集创新性地纳入了建筑工地等特殊场景，通过工人统一着装带来的外观相似性挑战，推动算法对步态等深层特征的挖掘。

特点

作为面向复杂场景的多行人跟踪基准，CrowdTrack展现出三大核心特征：场景多样性方面，其覆盖室内外12类真实环境，包含704K标注框和5,185条轨迹，平均每帧20.3个目标，密度超越MOT20；挑战性维度上，通过量化分析证实其具有最低的连续帧IoU分数(0.72)和最高的相对位置切换频率(0.025)，表明目标运动模式更为复杂；标注质量层面，采用第一人称视角拍摄，平均真实IoU达到0.55，与DanceTrack相当但更具自然交互特性。这些特征共同构成了对现有算法的全面压力测试。

使用方法

该数据集支持多层次的科研应用：基准测试方面，提供标准训练集(17视频)和测试集(16视频)划分，建议采用HOTA作为核心指标以平衡检测与关联性能；算法开发层面，其丰富的运动模糊、密集遮挡案例特别适合研究多模态特征融合策略，论文中验证了运动信息在复杂场景下的优越性；新兴探索方向上，团队已示范如何利用CLIP等基础模型进行轻量化ReID网络构建，特征可视化显示该数据集能有效推动跨模态表征学习。所有数据及评测代码均已开源，遵循MOTChallenge标准协议。

背景与挑战

背景概述

CrowdTrack是由复旦大学的研究团队于2025年提出的一个大规模多行人跟踪数据集，旨在解决复杂场景下的多目标跟踪问题。该数据集包含33个视频序列，共计5,185条轨迹，覆盖了购物中心、建筑工地、地下车站等多种真实场景。CrowdTrack的独特之处在于其第一人称视角和高度拥挤的场景设计，为行人跟踪算法在遮挡、运动模糊和密集人群等复杂条件下的鲁棒性提供了新的研究平台。该数据集的发布填补了现有MOT数据集在场景复杂性和真实性方面的不足，推动了计算机视觉领域在多目标跟踪方向的研究进展。

当前挑战

CrowdTrack面临的主要挑战包括：1) 领域问题方面，现有跟踪算法在高度拥挤场景中难以处理频繁的遮挡和外观相似性问题，导致身份切换(ID Switch)显著增加；2) 构建过程中，数据采集需要平衡场景多样性与隐私保护，而标注工作则面临密集人群中的目标区分难题，特别是对于部分遮挡目标的完整边界框标注。此外，数据集中工人制服等特殊场景进一步加大了外观特征提取的难度，这对传统依赖外观相似性的ReID方法提出了严峻考验。

常用场景

经典使用场景

CrowdTrack数据集作为计算机视觉领域多目标追踪（MOT）研究的重要基准，其经典使用场景聚焦于复杂真实环境下的密集行人追踪。该数据集通过第一人称视角采集的33段视频序列，包含5,185条轨迹和超过70万标注框，特别针对遮挡、运动模糊、人群密集等挑战性场景设计。其数据覆盖购物中心、建筑工地、地铁站等多样化日常场景，为算法在非结构化环境中的鲁棒性评估提供了标准化测试平台。

实际应用

在实际应用层面，CrowdTrack直接服务于智能监控、自动驾驶和具身智能等关键领域。其第一人称视角数据可优化服务机器人在拥挤商场中的避障导航，建筑工地场景的标注则有助于提升安全监控系统对穿戴相似工作人员的追踪精度。数据集包含的40,000帧动态影像为视频分析系统提供了应对低光照、运动模糊等现实干扰因素的训练样本，显著增强了算法在真实部署环境中的可靠性。

衍生相关工作

该数据集已催生多项创新研究：基于OVTrack的开放词汇追踪框架利用CLIP特征增强跨场景泛化能力；MASA方法结合SAM分割模型实现细粒度实例追踪；ViPT则探索多模态输入对复杂场景的增强效果。论文中验证的DiffusionTrack和OC-SORT等算法在CrowdTrack上的性能对比，为下一代MOT算法设计提供了重要参考方向，推动领域向更具鲁棒性的端到端架构发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

CrowdTrack

CrowdTrack数据集概述

数据集基本信息

数据集内容

相关论文

排行榜