CrowdPose

Name: CrowdPose
Creator: CrowdPose
License: 暂无描述

arXiv2025-09-30 收录

下载链接：

https://github.com/jeff-sjtu/crowdpose

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为CrowdPose，是一个在自然场景中人群密集情况下的2D姿态基准评测数据集。它特别针对在遮挡情况下的姿态准确性进行了评估，旨在对严重遮挡条件下的2D姿态评估任务进行深入研究和考量。

CrowdPose is a 2D pose estimation benchmark dataset developed for natural scenes with dense crowds. It specifically focuses on evaluating pose accuracy under occlusion conditions, aiming to enable in-depth research and comprehensive consideration of 2D pose estimation tasks under severe occlusion conditions.

提供机构：

CrowdPose

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，密集场景下的多人姿态估计一直面临挑战，现有基准数据集如MSCOCO和MPII在拥挤场景覆盖不足。CrowdPose数据集的构建旨在填补这一空白，其核心在于重新定义拥挤指数以量化图像拥挤程度，并基于该指数从现有公开数据集中均匀采样图像。通过跨标注策略，对选定的20,000张图像进行高质量的关键点标注，涵盖约80,000个人体实例，确保标注的一致性与准确性。数据集的训练、验证和测试集按5:1:4比例划分，且拥挤指数在0到1范围内呈均匀分布，从而促进模型在不同拥挤场景下的泛化能力。

特点

CrowdPose数据集的核心特点在于其拥挤场景的全面覆盖与均衡分布。通过引入拥挤指数这一创新度量，数据集有效量化了图像中人体遮挡的复杂程度，避免了仅依赖人数统计的局限性。与现有数据集相比，CrowdPose在拥挤指数上呈现均匀分布，涵盖了从简单日常场景到极端拥挤情况的全谱系样本。此外，数据集中人体边界框的平均交并比达到0.27，显著高于其他基准数据集，反映了更密集的空间布局。这种设计不仅挑战了现有姿态估计算法的极限，也为模型在多样现实场景中的鲁棒性评估提供了可靠平台。

使用方法

CrowdPose数据集的使用主要围绕密集场景下多人姿态估计算法的训练与评估展开。研究者可利用其均匀分布的拥挤指数，系统性地分析模型在不同拥挤程度下的性能变化。在训练阶段，数据集支持采用两阶段框架，即先进行人体检测，再执行单人姿态估计，并可结合论文提出的关节候选损失函数以提升模型对遮挡的鲁棒性。评估时，遵循MSCOCO的关键点相似度指标，计算平均精度与平均召回率，并可进一步按拥挤指数将测试集划分为简单、中等和困难子集，以细致考察算法性能。数据集的公开可用性促进了密集姿态估计领域的标准化比较与算法创新。

背景与挑战

背景概述

CrowdPose数据集由上海交通大学和清华大学的研究团队于2019年提出，旨在解决密集场景下的多人姿态估计问题。该数据集聚焦于计算机视觉领域中的关键挑战——在人群高度密集、遮挡严重的图像中准确识别和定位人体关键点。其核心研究问题在于克服传统姿态估计方法在拥挤场景中性能显著下降的局限，通过引入拥挤指数（Crowd Index）量化场景密集度，并构建了包含约20,000张图像、80,000个人体实例的基准数据。CrowdPose的发布推动了姿态估计模型向更复杂现实场景的泛化能力，为后续研究提供了重要的评估工具。

当前挑战

CrowdPose数据集主要应对两大挑战：在领域问题层面，它致力于解决密集场景中因人体相互遮挡、边界框重叠导致的姿态估计错误，例如关节误关联或冗余姿态预测，这要求模型具备更强的全局推理和抗干扰能力。在构建过程中，挑战包括从现有数据集中均匀采样不同拥挤程度的图像，确保数据分布的平衡性；同时，重新标注关键点以统一格式并保证标注质量，需通过交叉验证和平均计算来减少人工标注在密集场景中的误差，从而提升数据集的可靠性与实用性。

常用场景

经典使用场景

在计算机视觉领域，密集场景下的姿态估计一直是一项极具挑战性的任务。CrowdPose数据集通过精心设计的拥挤指数（Crowd Index）均匀分布，为算法在复杂人群环境中的性能评估提供了标准化基准。该数据集最经典的使用场景在于评估和优化多人体姿态估计算法在高度遮挡和密集交互情况下的鲁棒性，尤其适用于体育赛事、公共集会等实际密集场景的仿真测试。

衍生相关工作

CrowdPose数据集的发布催生了一系列专注于密集场景姿态估计的创新研究。例如，基于该数据集的联合候选损失（Joint-Candidate Loss）和图优化关联算法被广泛采纳，后续工作如改进的全局图匹配方法、多尺度特征融合网络等均受其启发。这些衍生研究进一步推动了遮挡处理、实时推理效率等关键问题的进展，形成了密集姿态估计领域的核心方法论体系。

数据集最近研究