five

NWPU-Refer

收藏
arXiv2025-06-04 更新2025-06-06 收录
下载链接:
https://github.com/CVer-Yang/NWPU-Refer
下载链接
链接失效反馈
官方服务:
资源简介:
NWPU-Refer是一个大规模的、多样化的遥感图像分割数据集,包含来自30多个国家的15,003张高分辨率图像(1024-2048px),支持单对象、多对象和非对象分割场景。该数据集的创建旨在促进遥感图像分割领域的发展,解决现有数据集在分辨率、场景多样性和类别覆盖方面的局限性。数据集的应用领域包括遥感图像分割、目标检测、场景理解等,旨在提高遥感图像分割模型的泛化能力和实际应用性。

NWPU-Refer is a large-scale and diverse remote sensing image segmentation dataset. It contains 15,003 high-resolution images ranging from 1024 to 2048 pixels sourced from over 30 countries, and supports single-object, multi-object and non-object segmentation scenarios. This dataset is developed to advance the development of the remote sensing image segmentation field, addressing the limitations of existing datasets in terms of resolution, scene diversity and category coverage. Its application areas include remote sensing image segmentation, object detection, scene understanding and other related fields, aiming to improve the generalization ability and practical applicability of remote sensing image segmentation models.
提供机构:
西北工业大学人工智能、光学与电子学院
创建时间:
2025-06-04
原始信息汇总

NWPU-Refer数据集概述

数据集基本信息

  • 数据集名称: NWPU-Refer
  • 官方仓库: https://github.com/CVer-Yang/NWPU-Refer
  • 数据集描述: 大规模遥感图像分割参考数据集与基准

数据集获取

  • 下载地址: https://pan.baidu.com/s/1HzLVXSqk_m4zWWJ-EJ5SkA
  • 提取码: NWPU

相关资源

  • 开源内容: 数据集与代码将在官方仓库中开源
搜集汇总
数据集介绍
main_image_url
构建方式
NWPU-Refer数据集的构建采用了系统化的标注流程,确保了数据的精确性和多样性。首先,研究团队定义了32个常见的遥感图像目标类别,涵盖了交通、基础设施、自然景观等多个领域。随后,通过多语言标注策略,生成了基于尺寸、空间关系、颜色属性等六个维度的描述。标注过程由四位专家团队完成,其中三位负责初始标注,另一位进行质量审核,所有标注均为手动完成,避免了自动化工具可能引入的误差。数据来源覆盖了五大洲的多样化地理环境,包括城市、乡村、森林等多种场景,确保了数据的地理多样性和场景丰富性。
特点
NWPU-Refer数据集是目前最大且最多样化的遥感参考图像分割数据集,包含15,003张高分辨率图像(1024-2048像素),覆盖30多个国家,标注目标数量达到49,745个。该数据集支持单目标、多目标和无目标分割场景,并引入了基于类别的参考表达,增强了任务的灵活性和实用性。图像分辨率在0.12米至0.5米之间,能够捕捉丰富的细节信息。此外,数据集还包含了复杂的背景和多目标上下文,模拟了真实世界中的遥感图像场景,为模型提供了更具挑战性的测试环境。
使用方法
NWPU-Refer数据集的使用方法包括数据分割、模型训练和性能评估三个主要步骤。数据集按7:1:2的比例划分为训练集、验证集和测试集,确保样本在不同区域的分布均衡。模型训练可采用提出的多尺度参考分割网络(MRSNet),该网络通过内部尺度特征交互模块(IFIM)和层次特征交互模块(HFIM)实现了多尺度特征的提取和融合。性能评估采用精确度阈值(P@0.7, P@0.8, P@0.9)、整体IoU(oIoU)和平均IoU(mIoU)等指标,全面衡量模型在不同场景下的表现。数据集支持中英双语查询,适用于跨语言视觉语言研究。
背景与挑战
背景概述
NWPU-Refer数据集由西北工业大学的研究团队于2025年提出,是针对遥感图像指代分割任务(Referring Remote Sensing Image Segmentation, RRSIS)构建的大规模基准数据集。该数据集包含15,003张高分辨率遥感图像(1024-2048像素),覆盖全球30多个国家的多样化地理场景,并标注了49,745个目标实例,支持单目标、多目标及无目标分割场景。作为计算机视觉与自然语言处理的交叉领域研究,RRSIS任务要求模型根据自然语言描述精确定位并分割遥感图像中的目标区域。NWPU-Refer通过引入地理多样性、多语言标注(中英文)和复杂场景覆盖,显著提升了现有数据集的规模和实用性,为遥感图像语义理解与交互式分割研究提供了重要基础设施。
当前挑战
NWPU-Refer数据集面临的挑战主要体现在两方面:领域问题层面,遥感图像的多尺度目标(如从大型建筑到微小车辆)、低对比度背景与复杂空间关系,导致传统指代分割模型难以实现精准的跨模态对齐;构建过程层面,需克服高分辨率图像标注成本高、多语言描述一致性维护,以及真实场景中目标遮挡、模糊边界等复杂情况的标注质量控制问题。此外,数据集中类别分布不均衡(如车辆、船舶等高频目标占比显著高于水坝、高尔夫球场等稀有类别),进一步增加了模型泛化能力优化的难度。
常用场景
经典使用场景
NWPU-Refer数据集在遥感图像分割领域具有广泛的应用场景,特别是在基于自然语言描述的特定目标分割任务中。该数据集通过高分辨率图像和多样化的地理场景,为研究者提供了丰富的实验材料。其经典使用场景包括单目标分割、多目标分割以及无目标分割,这些场景覆盖了从简单到复杂的各种遥感图像分析需求。例如,在城市规划中,可以通过描述“所有建筑物”来精确分割出图像中的建筑区域;在交通监控中,可以通过“道路上行驶的车辆”来识别和分割交通流量。
解决学术问题
NWPU-Refer数据集解决了遥感图像分割领域中的多个关键学术问题。首先,它通过提供高分辨率图像(1024-2048像素)和多样化的场景(覆盖30多个国家的城市、乡村、森林、沙漠和海洋等),显著提升了模型的泛化能力和实际应用性。其次,数据集引入了类别级别的参考表达,支持多目标和无目标场景的分割,从而扩展了任务的灵活性。此外,手动生成的高质量标注避免了自动工具可能引入的细微误差,为精确分割任务提供了可靠的数据基础。这些创新使得该数据集成为推动遥感图像分割研究的重要资源。
衍生相关工作
NWPU-Refer数据集的发布催生了一系列相关研究工作,特别是在多尺度特征融合和跨模态对齐方面。例如,基于该数据集提出的多尺度参考分割网络(MRSNet)通过引入尺度内特征交互模块(IFIM)和层次特征交互模块(HFIM),显著提升了分割性能。此外,许多后续研究利用该数据集探索了遥感图像分割中的新方法,如基于Transformer的模型和跨模态注意力机制。这些工作不仅验证了数据集的实用价值,还推动了遥感图像分割技术的进一步发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作