five

CrowdHuman|人群检测数据集|基准数据集数据集

收藏
github2021-12-05 更新2024-05-31 收录
人群检测
基准数据集
下载链接:
https://github.com/Asthestarsfalll/CrowdHuman
下载链接
链接失效反馈
资源简介:
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。

CrowdHuman is a benchmark dataset designed for evaluating the performance of detectors in crowded scenes. This dataset is characterized by its large scale, rich annotations, and high diversity, encompassing training, validation, and test sets with a total of 470,000 annotated human instances. On average, each image contains 23 individuals, including various occlusion scenarios. Each human instance is annotated with a head bounding box, a visible region bounding box, and a full-body bounding box.
创建时间:
2021-12-05
原始信息汇总

数据集概述

数据集名称

CrowdHuman

数据集目的

用于评估在人群场景中的检测器性能。

数据集规模

  • 训练集:15000张图像
  • 验证集:4370张图像
  • 测试集:5000张图像
  • 总人数实例:470K(训练和验证集)
  • 平均每张图像人数:23人

数据集特点

  • 包含多种遮挡情况
  • 每个人实例标注有头部边界框、可见区域边界框和全身边界框

数据集结构

标注格式

  • 文件格式:odgt,每行是一个JSON,包含对应图像的所有标注信息。

  • JSON结构: python JSON{ "ID" : image_filename, "gtboxes" : [gtbox], } gtbox{ "tag" : "person" or "mask", "vbox": [x, y, w, h], "fbox": [x, y, w, h], "hbox": [x, y, w, h], "extra" : extra, "head_attr" : head_attr, } extra{ "ignore": 0 or 1, "box_id": int, "occ": int, } head_attr{ "ignore": 0 or 1, "unsure": int, "occ": int, }

  • 标注说明:

    • tagmask表示该框为人群/反射/类似人物等,需忽略(extra中的ignore1
    • vbox, fbox, hbox分别表示可见框、全框、头框

下载链接

使用指南

标注转换

  • 使用脚本crowdhuman2coco.py将CrowdHuman标注转换为COCO格式。

数据集类

  • 提供PyTorch和MegEngine的简单实现,用于读取CrowdHuman数据集。

  • 数据集类支持的返回顺序: python class CrowdHuman(VisionDataset): supported_order = ( "image", "boxes", "vboxes", "hboxes", "boxes_category", "info", )

  • 示例使用: python crowdhuman_dataset = CrowdHuman( root=path/to/CrowdHuman, ann_file=path/to/annotations.json, remove_images_without_annotations=True, order=[ image, boxes, boxes_category info ] )

AI搜集汇总
数据集介绍
main_image_url
构建方式
CrowdHuman数据集的构建旨在为人群场景中的检测器提供一个全面的评估基准。该数据集包含15000张训练图像、4370张验证图像和5000张测试图像,总计470K个人类实例。每张图像平均包含23个人,且具有多种遮挡情况。每个实例均标注了头部边界框、可见区域边界框和全身边界框,确保了数据集的丰富性和多样性。通过这种详尽的标注方式,CrowdHuman数据集为人群检测任务提供了坚实的基础。
使用方法
使用CrowdHuman数据集时,用户首先需要下载并解压数据集文件,确保图像和标注文件的正确路径。随后,可以通过提供的脚本将标注文件转换为COCO格式,便于后续处理。数据集支持PyTorch和MegEngine框架,用户可以通过简单的代码实例化CrowdHuman数据集类,并根据需求选择返回的标注信息。这种灵活的使用方式使得CrowdHuman数据集适用于各种人群检测任务的研究和开发。
背景与挑战
背景概述
CrowdHuman数据集是由一群专注于人群场景检测的研究人员和机构创建的,旨在为评估人群场景中的检测器提供一个坚实的基础。该数据集于近年发布,包含了大量的图像和丰富的标注信息,涵盖了训练、验证和测试三个部分,共计24370张图像。CrowdHuman数据集的独特之处在于其高度的多样性和复杂性,每张图像平均包含23个人体实例,且存在多种遮挡情况。每个实例都标注了头部边界框、可见区域边界框和全身边界框,这些详细的标注为人群检测任务的研究提供了宝贵的资源。
当前挑战
CrowdHuman数据集在构建过程中面临了多重挑战。首先,由于人群场景的复杂性,数据集需要处理大量的遮挡和重叠问题,这增加了标注的难度和准确性要求。其次,数据集的规模庞大,包含近50万个标注实例,这不仅对存储和处理能力提出了高要求,也增加了数据管理和维护的复杂性。此外,数据集的多样性要求在不同环境和光照条件下进行标注,确保数据集的广泛适用性。这些挑战共同构成了CrowdHuman数据集在人群检测领域中的重要研究课题。
常用场景
经典使用场景
CrowdHuman数据集在人群检测领域中被广泛应用于评估和提升检测算法在密集人群场景中的性能。其丰富的标注信息,包括头部、可见区域和全身的边界框,使得研究人员能够更精确地分析和改进人群检测模型。通过将CrowdHuman数据集转换为COCO格式,研究人员可以利用现有的深度学习框架进行模型训练和验证,从而推动人群检测技术的发展。
解决学术问题
CrowdHuman数据集解决了在人群密集场景中检测算法的性能评估问题。传统的检测数据集往往缺乏对人群密集和遮挡情况的充分标注,导致模型在实际应用中表现不佳。CrowdHuman通过提供大量多样化的标注数据,帮助研究人员开发和验证能够有效处理人群密集和遮挡问题的检测算法,从而推动了人群检测领域的学术研究进展。
实际应用
CrowdHuman数据集在实际应用中具有广泛的应用前景,特别是在公共安全和监控领域。例如,在大型集会、体育赛事和交通枢纽等场景中,人群检测算法能够实时监控和分析人群动态,及时发现异常行为或潜在的安全威胁。此外,该数据集还可用于智能交通系统中的人群计数和行为分析,提升城市管理的智能化水平。
数据集最近研究
最新研究方向
在人群检测领域,CrowdHuman数据集因其丰富的标注和高度的多样性,已成为评估检测器在拥挤场景中性能的重要基准。最新研究方向主要集中在利用CrowdHuman数据集提升检测算法在复杂环境下的鲁棒性和准确性。研究者们通过引入多尺度特征融合、注意力机制以及深度学习模型的优化,旨在解决人群中常见的遮挡问题,从而提高检测器的整体性能。此外,CrowdHuman数据集还被广泛应用于开发和验证新的检测框架,推动了人群检测技术在实际应用中的进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CosyVoice 2

CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。

arXiv 收录

World Flights

该数据集包含使用OpenSky Network实时API收集的两小时飞行数据。飞行颜色基于出发国家,记录了18000次飞行,由于缺乏卫星覆盖,海洋上的航线不完整。每条航线还加入了来自airlinecodes.co.uk的航空公司信息。

github 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

CHARLS

中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。

charls.pku.edu.cn 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录