five

NWPU-Crowd|人群分析数据集|计算机视觉数据集

收藏
arXiv2020-08-04 更新2024-06-21 收录
人群分析
计算机视觉
下载链接:
https://gjy3035.github.io/NWPU-Crowd-Sample-Code/
下载链接
链接失效反馈
资源简介:
NWPU-Crowd是一个大规模的人群计数和定位数据集,由西北工业大学计算机科学与技术学院与光学影像分析与学习中心创建。该数据集包含5109张图像,总计2,133,375个标注头部,适用于监督学习算法。数据集的特点包括高分辨率、包含负样本以及大的外观变化,旨在解决极端拥挤场景下的人群计数和定位问题。数据集的创建过程涉及从互联网和自拍摄影中收集数据,并通过高效的标注工具进行标注。NWPU-Crowd的应用领域包括人群监控、公共安全和空间设计等。
提供机构:
西北工业大学计算机科学与技术学院与光学影像分析与学习中心
创建时间:
2020-01-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
NWPU-Crowd数据集通过综合自拍摄和互联网资源构建,包含5,109张图像,总计2,133,375个标注头部。数据集的构建过程包括数据收集、去重、清理和标注。数据收集涵盖了中国多个城市的典型人群场景,并通过图像搜索引擎获取了大量样本。去重和清理过程采用了基于VGG-16特征的感知损失方法,确保数据集的多样性和高质量。标注工具支持点标注和边界框标注,通过多阶段的标注和精细化过程,确保了标注的准确性和一致性。
特点
NWPU-Crowd数据集具有多个显著特点:首先,它是目前最大规模的人群计数和定位数据集,涵盖了从0到20,033的广泛密度范围,包含各种光照条件和场景。其次,数据集引入了351个负样本,这些样本在纹理特征上与拥挤人群场景相似,有助于提升模型的泛化能力。此外,数据集提供了高分辨率的图像,平均分辨率为2191×3209,最大图像尺寸达到4028×19044,为极端拥挤场景的计数提供了高质量的数据支持。最后,数据集开发了一个在线基准网站,允许研究者提交测试集结果,进行公平的性能评估。
使用方法
NWPU-Crowd数据集适用于各种基于深度学习的人群计数和定位任务。研究者可以使用该数据集训练和验证其模型,通过在线基准网站提交测试集结果,获取性能评估。数据集的多样性和高质量标注使其成为开发和评估人群分析算法的理想选择。此外,数据集的高分辨率和广泛密度范围为研究极端拥挤场景下的计数和定位问题提供了宝贵的资源。研究者可以通过分析数据集中的负样本和不同光照条件下的表现,进一步提升模型的鲁棒性和适应性。
背景与挑战
背景概述
NWPU-Crowd数据集是由西北工业大学计算机科学与工程学院和光学图像分析与学习中心(OPTIMAL)的研究人员于20XX年构建的,旨在解决大规模人群计数和定位问题。该数据集包含了5,109张图像,总计2,133,375个标注头部,涵盖了从0到20,033的密度范围,是目前已知最大规模的人群计数数据集之一。主要研究人员包括Qi Wang、Junyu Gao、Wei Lin和Xuelong Li等。该数据集的构建旨在弥补现有数据集规模不足的问题,推动基于卷积神经网络(CNN)的人群分析技术的发展,特别是在人群监控、公共安全、空间设计等领域的应用。
当前挑战
NWPU-Crowd数据集在构建过程中面临了多个挑战。首先,如何在大规模数据中准确标注人群头部是一个复杂且耗时的任务。其次,数据集中包含了各种光照条件和密度级别的图像,这增加了模型学习的难度。此外,数据集中引入了负样本(如高密度非人群图像),以评估模型的鲁棒性,这也为模型的训练和评估带来了新的挑战。最后,如何设计一个公平的评估基准,以确保不同方法的比较公正性,也是一个重要的挑战。
常用场景
经典使用场景
NWPU-Crowd数据集在人群计数和定位领域中具有经典应用场景。其大规模、高分辨率以及多样化的光照条件使其成为评估和改进人群分析算法的理想平台。通过提供详细的头部标注,该数据集支持深度学习模型在复杂场景中进行精确的人群计数和定位,从而推动了公共安全监控、城市空间设计和大型活动管理等应用的发展。
衍生相关工作
NWPU-Crowd数据集的发布催生了一系列相关研究工作。研究者们基于该数据集开发了多种先进的人群计数和定位算法,如多尺度卷积神经网络(MCNN)、尺度聚合网络(SANet)和空间全卷积网络(SFCN)。此外,该数据集还促进了负样本处理、光照变化适应和极端密度场景下的模型优化等研究方向的发展,为人群分析领域的技术创新提供了新的思路和方法。
数据集最近研究
最新研究方向
在人群分析领域,NWPU-Crowd数据集的引入为人群计数和定位研究提供了新的基准。该数据集不仅规模庞大,包含5,109张图像和2,133,375个标注头部,还涵盖了广泛的照明场景和密度范围(0∼20,033),使其成为当前最全面的人群计数数据集之一。前沿研究方向主要集中在如何利用这一数据集提升模型的鲁棒性和准确性,特别是在极端拥挤和复杂光照条件下的表现。此外,研究者们也在探索如何通过引入负样本(如密集排列的非人群物体)来增强模型的泛化能力,以及如何设计更有效的评估指标和方法来公平地比较不同模型。这些研究不仅推动了人群分析技术的发展,也为公共安全和城市规划等实际应用提供了更可靠的技术支持。
相关研究论文
  • 1
    NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization西北工业大学计算机科学与技术学院与光学影像分析与学习中心 · 2020年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

望诊影像数据集及诊断文本数据集

中医望诊数据集包含舌诊图片3000张、面诊图片2000张、目诊图片3000张,舌诊图片的内容部分为舌头(属口颌系统),面诊图片的内容部分包括了面和唇(属其他系统)、眼睛部分做了脱敏处理,目诊图片的内容部分为眼睛(属感觉系统)。该数据集提供舌诊图像的齿痕、裂纹、点刺、苔色、胖瘦的标注信息;以及面诊图像的唇色、唇形、面神的标注信息;目诊图像的特征属性包括颜色名称、颜色HSL值、大小、特征出处。

国家人口健康科学数据中心 收录