five

NWPU-MOC

收藏
arXiv2024-01-19 更新2024-06-21 收录
下载链接:
https://github.com/lyongo/NWPU-MOC
下载链接
链接失效反馈
官方服务:
资源简介:
NWPU-MOC数据集是由西北工业大学创建的一个大规模多类别目标计数数据集,包含3416个场景,每个场景分辨率为1024×1024像素,并精细标注了14个细粒度目标类别。该数据集不仅包含RGB图像,还包含近红外(NIR)图像,后者能提供更丰富的特征信息,有助于解决RGB图像中由于植被、光照和天气条件导致的可见性问题。NWPU-MOC数据集主要用于解决航空场景中的多类别目标计数问题,旨在通过密度图方法实现对不同类别目标的准确计数,并解决类别间的相互干扰问题。

The NWPU-MOC dataset is a large-scale multi-class object counting dataset developed by Northwestern Polytechnical University. It comprises 3416 scenes, each with a resolution of 1024 × 1024 pixels, and is meticulously annotated with 14 fine-grained object categories. This dataset includes not only RGB images but also near-infrared (NIR) images, which provide richer feature information and help resolve the visibility issues in RGB images caused by vegetation, illumination and weather conditions. The NWPU-MOC dataset is primarily designed for addressing multi-class object counting tasks in aerial scenarios, aiming to achieve accurate counting of objects across different categories via density map methods and mitigate mutual interference between different categories.
提供机构:
西北工业大学
创建时间:
2024-01-19
搜集汇总
数据集介绍
main_image_url
构建方式
在遥感与计算机视觉领域,面向多类别目标计数的研究长期缺乏专用数据集。NWPU-MOC的构建旨在填补这一空白,其数据源自荷兰全境航拍影像,空间分辨率为0.25米/像素。研究团队精心筛选了港口、停车场、街区、工业区、机场、海滩、农田及湖泊等多种典型稀疏与密集场景,从中裁剪出3416张分辨率为1024×1024像素的图像。每张影像均包含红、绿、蓝及近红外四个光谱通道,并以伪彩色PNG格式保存近红外波段,为后续多光谱分析提供了基础。标注过程采用精细化管理,由11名标注员对14个细粒度目标类别进行中心点标注,并经过交叉校验与反复精修,最终生成包含坐标信息的JSON文件及便于使用的Numpy格式文件。
特点
NWPU-MOC数据集的核心特征体现在其多光谱与多类别标注的深度融合。与现有单类别遥感计数数据集相比,该数据集首次在同一影像中同步标注了船只、车辆、建筑物、树木、集装箱、飞机等14个细粒度目标类别,标注点总数达383,195个,构建了大规模的多类别计数基准。尤为突出的是,数据集同时提供RGB与近红外影像,近红外波段因其较长波长,能够穿透大气并提供更丰富的表征信息,有助于缓解RGB影像中因植被遮挡、光照变化及天气条件导致的目标识别困难。此外,数据集中目标尺度差异显著、背景复杂、样本呈现长尾分布,并包含高密度场景,这些特性共同构成了对现有计数方法的严峻挑战,推动了多类别计数任务的发展。
使用方法
该数据集主要用于训练与评估多类别目标计数模型。在使用时,通常将RGB与近红外影像作为双输入,通过骨干网络提取多尺度特征,并利用特征金字塔网络进行融合。针对多类别计数任务,模型需回归一个多通道密度图,每个通道对应一个目标类别,通过对各通道密度值求和即可获得各类别的计数结果。为提升模型性能,可采用双注意力模块来有效融合RGB与近红外特征,并设计空间对比损失函数来建模密度图通道与目标类别间的映射关系,减少不同通道在相同空间位置上的预测重叠。数据预处理常包括将图像缩放至统一尺寸(如512×512),并进行随机裁剪、翻转等增强操作。评估时,除常用的平均绝对误差和均方根误差外,针对类别不平衡问题,引入了加权均方误差等新指标,以更合理地衡量模型在各类别上的综合计数性能。
背景与挑战
背景概述
遥感与计算机视觉领域长期致力于从空中视角进行目标计数研究,旨在通过图像自动估算特定类别物体的数量,以服务于城市规划、环境监测等实际应用。然而,现有方法多聚焦于单类别目标计数,难以应对航拍图像中多类别物体同时存在的复杂场景。为此,西北工业大学的研究团队于2024年正式发布了NWPU-MOC数据集,该数据集包含3,416个分辨率为1024×1024的航拍场景,并精细标注了船只、车辆、建筑等14个细粒度目标类别的中心点。每个场景均提供RGB与近红外(NIR)双谱段图像,其中NIR谱段能够穿透大气层,为遮挡情况下的目标识别提供更丰富的特征信息。该数据集的建立填补了多类别目标计数任务在航拍领域的空白,为开发更鲁棒、更通用的计数模型奠定了关键基础。
当前挑战
NWPU-MOC数据集所应对的核心领域挑战是实现航拍图像中的多类别目标计数,这要求模型不仅能准确估算物体数量,还需有效区分不同类别。具体构建与使用中的挑战包括:首先,航拍图像存在显著的目标尺度变化,同一画面中可能同时包含大型建筑与小型车辆;其次,复杂背景、植被遮挡、光照与天气变化等因素干扰目标可见性,增加了识别难度;再者,数据集中各类别样本呈现长尾分布,例如汽车类样本远多于飞机类,易导致模型训练偏差;此外,部分场景如港口、停车场存在目标高度密集的情况,对模型在拥挤环境下的计数能力提出严峻考验。这些挑战共同构成了该领域算法研发需攻克的关键难点。
常用场景
经典使用场景
在遥感与计算机视觉领域,NWPU-MOC数据集为多类别目标计数任务提供了基准平台。该数据集通过整合RGB与近红外光谱图像,并精细标注14类地物目标,为算法开发与评估奠定了数据基础。其经典应用场景在于推动面向航空影像的多光谱、多目标联合计数模型研究,尤其适用于处理大尺度变化、复杂背景及目标遮挡等典型航空影像挑战。
解决学术问题
NWPU-MOC数据集主要解决了航空影像中多类别目标联合计数的学术难题。传统计数方法多针对单一类别,难以适应实际场景中多类目标共存的需求。该数据集通过提供多光谱输入与细粒度标注,支持模型学习跨类别特征表示与密度图回归,有效缓解了因植被遮挡、光照变化等因素导致的计数误差,并为长尾分布下的类别不平衡问题提供了研究基准。
衍生相关工作
基于NWPU-MOC数据集,研究者提出了多通道密度图计数框架,其中引入的双注意力模块与空间对比损失已成为多光谱特征融合与跨类别密度图建模的经典方法。该数据集亦促进了遥感计数领域对长尾分布评估指标的探索,如加权均方误差的提出,为后续多类别计数模型的公平评估提供了方法论基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作