CrowdHuman

Name: CrowdHuman
Creator: 旷视科技(Face++)
Published: 2018-05-01 06:49:54
License: 暂无描述

arXiv2018-05-01 更新2024-06-21 收录

下载链接：

https://sshao0516.github.io/CrowdHuman/

下载链接

链接失效反馈

官方服务：

资源简介：

CrowdHuman数据集由旷视科技创建，专注于解决人群中的人体检测问题。该数据集包含15000张训练图像、4370张验证图像和5000张测试图像，总计47万个人体实例，平均每张图像有22.6个人。数据集通过爬取Google图像搜索结果并进行严格筛选和标注，每个实例都标注了头部、可见区域和全身的边界框。CrowdHuman数据集的应用领域包括自动驾驶、智能监控和机器人技术等，旨在提高人群中人体检测的准确性和鲁棒性。

CrowdHuman dataset was created by Megvii Technology, focusing on solving the problem of human detection in crowded scenarios. This dataset includes 15,000 training images, 4,370 validation images and 5,000 test images, with a total of 470,000 human instances, averaging 22.6 individuals per image. It is constructed by crawling results from Google Image Search and conducting strict filtering and annotation. Each instance is annotated with bounding boxes for the head, visible area and full body. The application fields of CrowdHuman dataset include autonomous driving, intelligent surveillance, robotics and other areas, aiming to improve the accuracy and robustness of human detection in crowded environments.

提供机构：

旷视科技(Face++)

创建时间：

2018-05-01

搜集汇总

数据集介绍

构建方式

CrowdHuman数据集的构建方式主要通过从Google图片搜索引擎中抓取图像，使用约150个关键词进行查询，涵盖了世界上40多个不同城市的各种活动和视角。抓取到的图像经过筛选，最终保留了约25,000张图像，并随机分为训练、验证和测试集。数据集中的人体实例均经过详细的标注，包括头部边界框、可见区域边界框和全身边界框。

特点

CrowdHuman数据集的特点在于其规模大、标注丰富且包含高多样性。数据集中共有470K个人体实例，平均每张图像有22.6个人，且包含各种类型的遮挡。此外，数据集提供了三种类型的边界框标注，即头部边界框、可见区域边界框和全身边界框，为每种人体实例都标注了这三种类型的边界框。实验结果表明，CrowdHuman数据集在行人检测、头部检测等方面都取得了最先进的性能，并且可以作为一个强大的预训练数据集。

使用方法

CrowdHuman数据集的使用方法包括行人检测、头部检测等多种任务。用户可以根据需要选择不同的标注类型进行训练和评估。在实验中，研究人员使用了FPN和RetinaNet两种基准检测器，并在CrowdHuman数据集上进行了训练和评估。实验结果表明，CrowdHuman数据集对于检测算法的评估和改进具有重要的参考价值。

背景与挑战

背景概述

CrowdHuman数据集是一项针对人群场景中人类检测的基准数据集，由Shuai Shao、Zijian Zhao等人于2018年发布。该数据集旨在解决高度拥挤环境下人类检测的遮挡问题，并通过提供大量、丰富标注且高多样性的数据来更好地评估检测器在人群场景下的性能。CrowdHuman数据集包含来自训练和验证子集的共计470K个人类实例，每张图片平均有22.6个人，其中包含各种类型的遮挡。每个实例都标注有头部边界框、可见区域边界框和全身边界框。CrowdHuman数据集的发布对相关领域产生了重要影响，推动了未来人类检测任务的研究。

当前挑战

CrowdHuman数据集所解决的领域问题是人类在高度拥挤环境下的检测。在人群场景中，不同的人之间存在高度重叠，给检测器识别每个个体的边界带来了很大困难。此外，即使检测器能够区分人群中的不同行人，高度重叠的边界框也会被非最大值抑制（NMS）的后处理过程所抑制。因此，人群遮挡使得检测器对NMS的阈值非常敏感。较低的阈值可能导致召回率急剧下降，而较高的阈值则会带来更多的误报。构建过程中所遇到的挑战包括数据收集、标注和多样性。数据收集需要从互联网上获取大量包含人群场景的图像，并进行筛选和处理。标注过程需要标注每个实例的头部边界框、可见区域边界框和全身边界框，并确保标注质量。此外，数据集的多样性也是一个挑战，需要确保数据集能够涵盖各种不同的人群场景和活动。

常用场景

经典使用场景

CrowdHuman数据集被广泛应用于评估人群场景中的人体检测算法。该数据集提供了大量的高密度人群图像，并包含了丰富多样的遮挡情况。这使得CrowdHuman成为研究人群场景人体检测问题的理想基准数据集。通过在CrowdHuman上进行训练和评估，研究人员可以更好地理解和改进人体检测算法在人群场景中的性能。

衍生相关工作

CrowdHuman数据集的提出和发布，推动了人体检测领域的研究进展。基于CrowdHuman数据集，研究人员可以更好地研究和改进人体检测算法在人群场景中的性能。此外，CrowdHuman数据集的发布也促进了相关领域的交叉研究，例如人群行为分析、人群计数等。CrowdHuman数据集的衍生工作为人体检测领域的研究提供了新的思路和方向。

数据集最近研究