CrowdHuman

Name: CrowdHuman
Creator: OpenDataLab
Published: 2026-06-21 03:30:00
License: 暂无描述

OpenDataLab2026-06-21 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/CrowdHuman

下载链接

链接失效反馈

官方服务：

资源简介：

CrowdHuman 是一个基准数据集，可以更好地评估人群场景中的检测器。 CrowdHuman 数据集很大，注释丰富并且包含高度的多样性。 CrowdHuman 包含 15000、4370 和 5000 张图像，分别用于训练、验证和测试。训练和验证子集中共有 470K 人类实例，每张图像有 23 个人，数据集中有各种遮挡。每个人体实例都用头部边界框、人体可见区域边界框和人体全身边界框进行注释。我们希望我们的数据集将作为一个坚实的基线，并有助于促进人类检测任务的未来研究。

CrowdHuman is a benchmark dataset dedicated to better evaluating detectors in crowded scenarios. The CrowdHuman dataset boasts large scale, rich annotations and high diversity. It consists of 15000, 4370 and 5000 images for training, validation and test splits respectively. The training and validation subsets contain a total of 470K human instances, with an average of 23 humans per image, and the dataset covers various occlusion scenarios. Each human instance is annotated with three bounding boxes: the head bounding box, the visible human body bounding box, and the full-body bounding box. We hope that this dataset will serve as a solid baseline and help advance future research on human detection tasks.

提供机构：

OpenDataLab

创建时间：

2022-03-17

搜集汇总

数据集介绍

构建方式

CrowdHuman数据集的构建基于大规模的真实世界图像，涵盖了多种复杂场景，包括拥挤的街道、市场和公共交通枢纽。数据集通过精心设计的标注流程，确保了高精度的边界框标注，每个对象都配备了头部和全身的标注信息。此外，数据集还包含了遮挡和部分可见对象的详细标注，以增强其在实际应用中的鲁棒性。

特点

CrowdHuman数据集以其高密度和多样性著称，包含了超过150,000个标注对象，分布在47,000多张图像中。其独特之处在于对头部和全身的详细标注，这使得数据集在行人检测和人群分析任务中表现卓越。此外，数据集还特别关注了遮挡和部分可见对象的处理，提供了丰富的遮挡情况下的标注数据，从而提升了模型的泛化能力。

使用方法

CrowdHuman数据集适用于多种计算机视觉任务，特别是行人检测和人群分析。研究人员和开发者可以利用该数据集训练和评估模型，以提高在复杂和拥挤场景中的检测精度。数据集的标注信息可以直接用于监督学习，也可以通过数据增强技术进一步提升模型的性能。此外，CrowdHuman还提供了详细的评估指标和工具，方便用户进行性能分析和比较。

背景与挑战

背景概述

CrowdHuman数据集由ShanghaiTech、Microsoft Research Asia和SenseTime联合创建，旨在解决大规模人群场景中的行人检测问题。该数据集于2018年发布，包含了超过150万个人体实例，覆盖了各种复杂的城市环境。其核心研究问题是如何在高密度人群中准确检测和识别个体，这对于智能监控、自动驾驶和公共安全等领域具有重要意义。CrowdHuman的发布极大地推动了行人检测技术的发展，为相关研究提供了丰富的数据资源。

当前挑战

CrowdHuman数据集在构建过程中面临了多重挑战。首先，高密度人群中的遮挡问题严重影响了检测的准确性，如何有效处理遮挡是该数据集的主要挑战之一。其次，数据集的标注工作复杂且耗时，确保标注的准确性和一致性是一个巨大的挑战。此外，数据集的多样性和复杂性要求算法具备强大的泛化能力，以应对不同场景下的行人检测任务。这些挑战不仅推动了行人检测技术的进步，也为其他相关领域的研究提供了宝贵的经验。

发展历史

创建时间与更新

CrowdHuman数据集由Shanghai Jiao Tong University和Microsoft Research Asia于2018年共同创建，旨在解决人群中行人检测的挑战。该数据集自创建以来，未有公开的更新记录。

重要里程碑

CrowdHuman数据集的发布标志着行人检测领域的一个重要里程碑。它包含了15,000张图像，总计470,000个标注的行人实例，其中每个实例都提供了头部和全身的边界框标注。这一数据集的独特之处在于其对遮挡和拥挤场景的广泛覆盖，极大地推动了行人检测算法在复杂环境中的性能提升。此外，CrowdHuman还引入了遮挡标签，为研究遮挡问题提供了宝贵的数据资源。

当前发展情况

CrowdHuman数据集自发布以来，已成为行人检测研究中的重要基准。其丰富的标注和复杂的场景设计，使得许多先进的检测算法在其上进行了验证和优化。该数据集不仅推动了行人检测技术的发展，还促进了多目标跟踪和人群分析等领域的研究。随着深度学习技术的不断进步，CrowdHuman数据集的应用范围也在不断扩展，为智能监控、自动驾驶等实际应用场景提供了强有力的支持。

发展历程

CrowdHuman数据集首次发表，由ShanghaiTech、Microsoft Research Asia和Tsinghua University的研究团队共同推出，旨在解决人群中行人检测的挑战。
2018年
CrowdHuman数据集在计算机视觉领域的多个国际会议上被广泛讨论和引用，成为人群检测任务中的重要基准数据集。
2019年
CrowdHuman数据集的应用扩展到自动驾驶和智能监控领域，多个研究团队基于该数据集开发了新的行人检测算法。
2020年
CrowdHuman数据集的标注质量和多样性得到了进一步的验证和提升，成为全球范围内行人检测研究的重要参考。
2021年

常用场景

经典使用场景

在计算机视觉领域，CrowdHuman数据集因其大规模和高密度的人群图像而备受瞩目。该数据集广泛应用于人群检测和行人重识别任务中，为研究人员提供了丰富的样本资源。通过分析CrowdHuman数据集，研究者能够开发和验证更高效的人群检测算法，特别是在复杂场景下，如拥挤的街道、体育场馆和公共集会场所。

解决学术问题

CrowdHuman数据集解决了在人群密集场景中行人检测的难题。传统的行人检测算法在处理高密度人群时往往表现不佳，容易出现漏检或误检。CrowdHuman数据集通过提供高质量的标注数据，帮助研究者开发出更鲁棒的检测模型，显著提升了在复杂环境下的检测精度。这不仅推动了计算机视觉领域的发展，也为相关技术的实际应用奠定了坚实基础。

衍生相关工作

基于CrowdHuman数据集，许多经典工作得以展开。例如，研究者们开发了多种先进的行人检测算法，如基于深度学习的YOLO系列和Faster R-CNN的改进版本，这些算法在CrowdHuman数据集上的表现显著优于传统方法。此外，该数据集还促进了行人重识别技术的研究，推动了多目标跟踪和人群行为分析等领域的发展。

以上内容由遇见数据集搜集并总结生成