five

MMPTRACK

收藏
arXiv2021-11-30 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2111.15157v1
下载链接
链接失效反馈
官方服务:
资源简介:
MMPTRACK是由微软创建的大规模多摄像头多人跟踪数据集,包含约297万条密集标注的跟踪数据。该数据集通过自动标注系统生成,使用重叠和校准的深度和RGB摄像头构建高性能3D跟踪器,自动生成3D跟踪结果,并通过人工校正确保标注质量。数据集涵盖五种不同环境,旨在为复杂拥挤环境中的多摄像头多对象跟踪系统提供可靠基准。此外,数据集的应用领域包括多视角人物检测和单摄像头多人跟踪,旨在解决现有跟踪系统在复杂环境中性能不足的问题。

MMPTRACK is a large-scale multi-camera multi-person tracking dataset created by Microsoft, containing approximately 2.97 million densely annotated tracking data entries. Generated via an automatic annotation system, the dataset leverages overlapping and calibrated depth and RGB cameras to build a high-performance 3D tracker, automatically produces 3D tracking results, and adopts manual verification to ensure annotation quality. Covering five distinct environments, this dataset aims to provide a reliable benchmark for multi-camera multi-object tracking systems in complex and crowded scenarios. Additionally, the dataset can be applied to multi-view person detection and single-camera multi-person tracking, and is designed to address the performance deficiencies of existing tracking systems in complex environments.
提供机构:
微软
创建时间:
2021-11-30
搜集汇总
数据集介绍
main_image_url
构建方式
在多摄像头密集人群跟踪领域,数据标注的高昂成本长期制约着大规模高质量数据集的构建。MMPTRACK数据集通过创新的自动标注系统,有效解决了这一难题。该系统在五个多样化室内环境中部署了23台经过标定的RGB-D摄像头,通过深度传感器重建三维点云并投影为俯视图,利用基于检测的跟踪框架生成高质量的三维跟踪轨迹。随后,通过人工校正三维轨迹中的ID切换与误检,并将校正后的三维结果投影至各RGB相机视角,最终形成密集的每帧边界框与身份标注。这一流程在保证标注质量接近人工全标注(IDF1达100%,MOTA达99.9%)的同时,将标注成本降至传统方法的约1/800。
特点
作为当前规模最大的多摄像头多人跟踪数据集,MMPTRACK在数据规模与场景多样性方面具有显著优势。数据集涵盖零售店、大厅、工业区、咖啡馆及办公室五种具有挑战性的室内环境,总计提供约576分钟、近300万帧的同步多视角视频,所有帧均带有密集的边界框与跨相机一致的身份标注。其摄像头布局具有高度重叠的视场,且均经过精确的内外参标定,能够支持三维空间推理。与现有数据集相比,MMPTRACK不仅在视频时长与标注帧数上大幅领先,其场景设置更贴近无感支付等实际应用需求,为模型在复杂拥挤环境中的泛化能力评估提供了可靠基准。
使用方法
该数据集主要用于多摄像头多目标跟踪(MCMT)及相关任务的研究与评估。研究者可利用其训练与测试分割,开发和验证多摄像头跟踪算法、跨摄像头重识别模型以及多视角行人检测方法。数据集提供了三维空间与各相机视角的二维投影真值,支持算法在俯视图或原始视图上进行性能评测。基准实验表明,直接使用公开数据集预训练的模型在MMPTRACK上表现不佳,而利用其训练数据进行领域自适应或从头训练,能显著提升跟踪与重识别性能。因此,建议研究者利用该数据集进行模型微调或训练,以应对复杂室内环境下的遮挡、拥挤与视角变化等挑战。
背景与挑战
背景概述
多摄像头多目标跟踪是计算机视觉领域的关键研究方向,尤其在零售无感支付等对跟踪精度要求极高的实际应用中具有重要价值。传统单目多目标跟踪系统在复杂拥挤场景中常因遮挡问题导致性能受限,而多视角重叠摄像头系统能通过恢复部分三维信息显著缓解此问题。MMPTRACK数据集由微软研究院于2021年推出,旨在构建大规模、高质量的多摄像头多人跟踪基准。该数据集在五个多样化室内环境中采集,包含23个高度重叠的校准摄像头,总时长约9.6小时,帧级标注超过250万,是目前该领域规模最大、标注最密集的公开数据集。其核心研究问题在于如何通过大规模高质量数据推动多摄像头跟踪算法在真实复杂场景中的性能突破,对智能监控、人机交互等领域产生了深远影响。
当前挑战
MMPTRACK数据集致力于解决多摄像头多人跟踪在复杂拥挤环境中的核心挑战。在领域问题层面,主要挑战包括:跨摄像头数据关联中因视角变化、光照差异和部分遮挡导致的外观特征匹配困难;三维空间轨迹重建时因投影误差和传感器噪声引起的定位精度下降;以及实时跟踪系统中检测与关联模块的协同优化难题。在构建过程中,数据集面临多重技术挑战:大规模多摄像头系统的精确标定与时间同步需要复杂算法支持;自动标注系统虽大幅提升效率,但三维跟踪器仍会产生轨迹ID切换和误检,需人工校正以保证标注质量;此外,在多样化环境(如零售、工业场景)中保持数据一致性与泛化能力,也对采集方案设计提出了更高要求。
常用场景
经典使用场景
在计算机视觉领域,多目标跟踪系统在复杂拥挤场景中常因遮挡问题而性能受限。MMPTRACK数据集通过提供大规模、密集标注的多摄像头多人跟踪数据,为这一经典挑战提供了理想的评估平台。其最经典的使用场景在于为多摄像头跟踪算法提供训练与测试基准,特别是在模拟零售商店、办公大厅等真实室内拥挤环境时,研究者可利用其校准的RGB-D摄像头数据与精确的3D投影标注,系统性地开发和验证能够有效处理遮挡与跨视角关联的先进跟踪模型。
实际应用
MMPTRACK数据集的设计紧密贴合对跟踪精度要求极高的现实应用需求。其涵盖的零售、工业、大厅等多种室内环境,直接对应于无感支付、智能安防、人流分析与服务机器人导航等实际场景。通过提供在这些复杂、拥挤且存在大量遮挡环境下的高质量跟踪真值,该数据集使得开发出的算法能够更好地适应真实世界的挑战,例如在超市中准确跟踪顾客购物路径,或在公共大厅中持续监控人员流动,为构建高可靠性的商业与安防智能视觉系统提供了至关重要的数据支撑。
衍生相关工作
基于MMPTRACK数据集,研究者们已开展并衍生出一系列经典的相关工作。论文本身评估了如DMCT(端到端深度多摄像头跟踪器)和VoxelTrack(基于三维骨架的跟踪器)等先进实时跟踪器的性能,并系统分析了不同训练策略(如使用额外数据、特定环境微调)的影响。这些基准实验为后续研究设立了性能参照点。此外,该数据集也促进了针对多视角行人检测、三维姿态估计以及跨摄像头行人重识别等关联任务的研究,其提供的丰富多视角同步数据与精确标定参数,成为开发与验证新型多模态融合算法和自监督学习方法的宝贵资源。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作