CrowdHuman

github2021-12-05 更新2024-05-31 收录

下载链接：

https://github.com/Asthestarsfalll/CrowdHuman

下载链接

链接失效反馈

官方服务：

资源简介：

CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性，包含训练、验证和测试集，共计47万个标注的人体实例，平均每张图像有23个人，包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。

CrowdHuman is a benchmark dataset designed for evaluating the performance of detectors in crowded scenes. This dataset is characterized by its large scale, rich annotations, and high diversity, encompassing training, validation, and test sets with a total of 470,000 annotated human instances. On average, each image contains 23 individuals, including various occlusion scenarios. Each human instance is annotated with a head bounding box, a visible region bounding box, and a full-body bounding box.

创建时间：

2021-12-05

原始信息汇总

数据集概述

数据集名称

CrowdHuman

数据集目的

用于评估在人群场景中的检测器性能。

数据集规模

训练集：15000张图像
验证集：4370张图像
测试集：5000张图像
总人数实例：470K（训练和验证集）
平均每张图像人数：23人

数据集特点

包含多种遮挡情况
每个人实例标注有头部边界框、可见区域边界框和全身边界框

数据集结构

标注格式

文件格式：odgt，每行是一个JSON，包含对应图像的所有标注信息。
JSON结构： python JSON{ "ID" : image_filename, "gtboxes" : [gtbox], } gtbox{ "tag" : "person" or "mask", "vbox": [x, y, w, h], "fbox": [x, y, w, h], "hbox": [x, y, w, h], "extra" : extra, "head_attr" : head_attr, } extra{ "ignore": 0 or 1, "box_id": int, "occ": int, } head_attr{ "ignore": 0 or 1, "unsure": int, "occ": int, }
标注说明：
- tag为mask表示该框为人群/反射/类似人物等，需忽略（extra中的ignore为1）
- vbox, fbox, hbox分别表示可见框、全框、头框

下载链接

训练集：CrowdHuman_train01.zip
训练集：CrowdHuman_train02.zip
训练集：CrowdHuman_train03.zip
验证集：CrowdHuman_val.zip
训练标注：annotation_train.odgt
验证标注：annotation_val.odgt
测试集：CrowdHuman_test.zip

使用指南

标注转换

使用脚本crowdhuman2coco.py将CrowdHuman标注转换为COCO格式。

数据集类

提供PyTorch和MegEngine的简单实现，用于读取CrowdHuman数据集。
数据集类支持的返回顺序： python class CrowdHuman(VisionDataset): supported_order = ( "image", "boxes", "vboxes", "hboxes", "boxes_category", "info", )
示例使用： python crowdhuman_dataset = CrowdHuman( root=path/to/CrowdHuman, ann_file=path/to/annotations.json, remove_images_without_annotations=True, order=[ image, boxes, boxes_category info ] )

搜集汇总

数据集介绍

构建方式

CrowdHuman数据集的构建旨在为人群场景中的检测器提供一个全面的评估基准。该数据集包含15000张训练图像、4370张验证图像和5000张测试图像，总计470K个人类实例。每张图像平均包含23个人，且具有多种遮挡情况。每个实例均标注了头部边界框、可见区域边界框和全身边界框，确保了数据集的丰富性和多样性。通过这种详尽的标注方式，CrowdHuman数据集为人群检测任务提供了坚实的基础。

使用方法

使用CrowdHuman数据集时，用户首先需要下载并解压数据集文件，确保图像和标注文件的正确路径。随后，可以通过提供的脚本将标注文件转换为COCO格式，便于后续处理。数据集支持PyTorch和MegEngine框架，用户可以通过简单的代码实例化CrowdHuman数据集类，并根据需求选择返回的标注信息。这种灵活的使用方式使得CrowdHuman数据集适用于各种人群检测任务的研究和开发。

背景与挑战

背景概述

CrowdHuman数据集是由一群专注于人群场景检测的研究人员和机构创建的，旨在为评估人群场景中的检测器提供一个坚实的基础。该数据集于近年发布，包含了大量的图像和丰富的标注信息，涵盖了训练、验证和测试三个部分，共计24370张图像。CrowdHuman数据集的独特之处在于其高度的多样性和复杂性，每张图像平均包含23个人体实例，且存在多种遮挡情况。每个实例都标注了头部边界框、可见区域边界框和全身边界框，这些详细的标注为人群检测任务的研究提供了宝贵的资源。

当前挑战

CrowdHuman数据集在构建过程中面临了多重挑战。首先，由于人群场景的复杂性，数据集需要处理大量的遮挡和重叠问题，这增加了标注的难度和准确性要求。其次，数据集的规模庞大，包含近50万个标注实例，这不仅对存储和处理能力提出了高要求，也增加了数据管理和维护的复杂性。此外，数据集的多样性要求在不同环境和光照条件下进行标注，确保数据集的广泛适用性。这些挑战共同构成了CrowdHuman数据集在人群检测领域中的重要研究课题。

常用场景

经典使用场景

CrowdHuman数据集在人群检测领域中被广泛应用于评估和提升检测算法在密集人群场景中的性能。其丰富的标注信息，包括头部、可见区域和全身的边界框，使得研究人员能够更精确地分析和改进人群检测模型。通过将CrowdHuman数据集转换为COCO格式，研究人员可以利用现有的深度学习框架进行模型训练和验证，从而推动人群检测技术的发展。

解决学术问题

CrowdHuman数据集解决了在人群密集场景中检测算法的性能评估问题。传统的检测数据集往往缺乏对人群密集和遮挡情况的充分标注，导致模型在实际应用中表现不佳。CrowdHuman通过提供大量多样化的标注数据，帮助研究人员开发和验证能够有效处理人群密集和遮挡问题的检测算法，从而推动了人群检测领域的学术研究进展。

实际应用

CrowdHuman数据集在实际应用中具有广泛的应用前景，特别是在公共安全和监控领域。例如，在大型集会、体育赛事和交通枢纽等场景中，人群检测算法能够实时监控和分析人群动态，及时发现异常行为或潜在的安全威胁。此外，该数据集还可用于智能交通系统中的人群计数和行为分析，提升城市管理的智能化水平。

数据集最近研究