JHU-CROWD++

Name: JHU-CROWD++
Creator: 约翰斯·霍普金斯大学
Published: 2020-11-03 01:52:27
License: 暂无描述

arXiv2020-11-03 更新2024-06-21 收录

下载链接：

http://www.crowd-counting.com

下载链接

链接失效反馈

官方服务：

资源简介：

JHU-CROWD++是由约翰斯·霍普金斯大学创建的大规模无约束人群计数数据集，包含4372张图像和151万个标注。该数据集在多种环境和场景下收集，特别考虑了天气影响和光照变化，使其成为极具挑战性的数据集。数据集提供了图像级和头部级的丰富标注，包括点级标注、近似尺寸、模糊级别等。JHU-CROWD++适用于评估和比较最新的人群计数方法，旨在解决复杂环境中的人群计数问题。

JHU-CROWD++ is a large-scale unconstrained crowd counting dataset developed by Johns Hopkins University. It comprises 4,372 images and over 1.51 million annotations. Collected across diverse environments and scenarios, this dataset takes deliberate consideration of weather impacts and illumination variations, rendering it a highly challenging benchmark for crowd counting research. It provides rich annotations at both image-level and head-level, including point-level head annotations, approximate head sizes, blur levels, and other relevant attributes. JHU-CROWD++ is designed to evaluate and compare state-of-the-art crowd counting methods, with the goal of addressing crowd counting challenges in complex real-world environments.

提供机构：

约翰斯·霍普金斯大学

创建时间：

2020-04-07

搜集汇总

数据集介绍

构建方式

在人群计数领域，JHU-CROWD++数据集的构建体现了对复杂现实场景的深度覆盖。该数据集通过互联网多源采集，精心筛选了4,372张图像，并标注了151万个人头位置。构建过程中特别纳入了雨、雪、雾等恶劣天气条件下的图像，以及106张干扰图像，以增强模型的泛化能力。标注信息不仅包括点级位置，还扩展至遮挡程度、模糊级别及近似头部尺寸，并通过亚马逊众包平台完成，确保了数据的多样性与标注质量。

特点

JHU-CROWD++数据集的核心特点在于其规模与复杂性。该数据集包含大量高密度人群图像，最大计数达25,791人，且平均图像分辨率较高。其独特之处在于首次系统性地引入了天气退化图像，覆盖雨、雪、雾等多种条件，并提供了丰富的多层级标注，如头部级别的遮挡、模糊标签及图像级别的场景与天气标签。这些特点使其成为评估模型在真实复杂环境下鲁棒性的重要基准。

使用方法

该数据集适用于训练与评估人群计数模型，尤其侧重于模型在多样化场景下的性能。研究通常将数据集划分为训练、验证与测试子集，采用随机裁剪等数据增强策略。评估时，除了整体均绝对误差与均方误差，还按人群密度与天气条件进行细分分析，以全面衡量模型在不同挑战下的表现。数据集的丰富标注可用于多任务学习，例如结合天气标签进行条件化训练，以提升模型在恶劣环境中的计数准确性。

背景与挑战

背景概述

随着全球人口增长与城市化进程加速，人群聚集现象日益普遍，计算机视觉领域的人群计数研究因此备受关注。JHU-CROWD++数据集由约翰斯·霍普金斯大学的研究团队于2020年正式发布，旨在解决现有数据集在样本规模、环境多样性及标注丰富度方面的局限。该数据集包含4,372张图像与151万条标注，覆盖了雨、雪、雾等多种恶劣天气条件，并引入了干扰图像以降低模型偏差。其核心研究问题在于提升人群计数模型在复杂真实场景中的鲁棒性与泛化能力，为人群分析、视频监控及城市规划等应用提供了关键数据支撑，推动了密集人群理解领域的技术进步。

当前挑战

在人群计数领域，模型需应对极端密度变化、尺度差异及遮挡等复杂场景的挑战。JHU-CROWD++通过引入恶劣天气图像与多样化环境条件，进一步增加了光照退化、背景干扰等识别难度，对模型的适应性与稳定性提出了更高要求。数据构建过程中，研究团队面临大规模高质量标注的获取难题，包括头部中心点、模糊程度、遮挡级别及近似尺寸等多维度信息的精细化标注，需克服人工标注成本高、一致性维护等实际困难。此外，数据集的平衡性与代表性亦需精心设计，以确保其在训练深度网络时的有效性与可靠性。

常用场景

经典使用场景

在人群计数研究领域，JHU-CROWD++数据集因其大规模、高复杂度的特性，成为评估和比较各类计数算法的经典基准。该数据集包含4,372张图像和超过150万个人头标注，覆盖了从低密度到极高密度的多样化人群场景。其图像采集自多种环境条件，包括雨、雪、雾等恶劣天气，以及复杂背景的干扰图像，这使得该数据集能够全面检验算法在真实世界中的鲁棒性和泛化能力。研究人员通常利用该数据集训练和测试卷积神经网络模型，通过生成人群密度图来精确估计图像中的人数，尤其在处理尺度变化、遮挡和模糊等挑战时展现出独特价值。

解决学术问题

JHU-CROWD++数据集主要解决了人群计数领域中几个关键学术问题。首先，它弥补了现有数据集中训练样本有限、环境多样性不足的缺陷，通过引入大量恶劣天气条件下的图像，推动了算法在退化场景下的性能研究。其次，数据集提供的丰富标注信息，如人头尺寸、模糊程度、遮挡级别及图像级天气标签，为多任务学习和条件建模提供了基础，有助于探索如何利用辅助信息提升计数精度。此外，数据集中包含的干扰图像有效缓解了模型因数据偏差而产生的误检问题，促进了更公平和稳健的评估。这些贡献显著提升了人群计数模型的实用性和可靠性。

衍生相关工作

JHU-CROWD++数据集的发布催生了一系列相关经典研究工作，尤其是在网络架构设计和多任务学习方面。以该数据集为基础，研究者提出了如CG-DRCN（置信度引导的深度残差计数网络）等先进模型，这些模型利用残差学习和不确定性估计逐步优化密度图生成。同时，数据集的丰富标注启发了如类条件化残差估计等方法，将天气标签融入训练过程以提升恶劣环境下的性能。此外，该数据集还被广泛用于评估和比较SA-Net、CSR-Net、BCC等现有先进方法，推动了人群计数领域在尺度适应性、上下文建模和损失函数设计等方面的持续创新与进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集