RWDS
收藏Hugging Face2025-06-13 更新2025-06-14 收录
下载链接:
https://huggingface.co/datasets/RWGAI/RWDS
下载链接
链接失效反馈官方服务:
资源简介:
Real-World Distribution Shifts (RWDS)数据集是一组针对人道主义和气候变化应用的新型领域泛化基准数据集。该数据集包含三个子数据集:RWDS-CZ、RWDS-FR和RWDS-HE,分别专注于气候区域、洪水区域和飓风事件的对象检测。数据集使用英语注释和元数据的卫星图像,旨在评估模型在不同气候区域和灾害场景下的泛化能力。
Real-World Distribution Shifts (RWDS) dataset is a novel domain generalization benchmark dataset for humanitarian and climate change applications. It comprises three sub-datasets: RWDS-CZ, RWDS-FR and RWDS-HE, which focus on object detection in climatic zones, flood zones and hurricane events respectively. The dataset provides satellite imagery paired with English annotations and metadata, aiming to evaluate the generalization capability of models across different climatic regions and disaster scenarios.
创建时间:
2025-06-13
搜集汇总
数据集介绍

构建方式
在卫星影像分析领域,RWDS数据集通过精心设计的构建流程实现了对真实世界分布偏移的系统性研究。该数据集整合了xView和xBD两大权威卫星影像源,采用地理坐标映射和气候分类技术,将原始数据重构为三个专业子集:RWDS-CZ依据柯本气候分类体系划分热带、干旱和温带区域;RWDS-FR聚焦美国和印度的洪灾区域;RWDS-HE则涵盖四次典型飓风事件。数据预处理过程严格遵循跨域可比性原则,包括类别筛选、样本平衡及基于论文算法的系统化分割,确保每个子集都能有效反映特定环境下的域偏移特征。
特点
作为卫星影像域泛化研究的标杆数据集,RWDS展现出多维度的学术价值。其核心优势在于构建了完整的域偏移评估体系,包含气候带差异、跨国界区域特征和极端天气事件三类真实场景。数据集提供512x512像素的高分辨率影像,标注信息涵盖16类地物目标及建筑损毁二元分类,特别设计了单源训练和多源训练两种实验范式。通过留一域出的划分方法,该数据集能严格检验模型在未知地理环境和灾害条件下的泛化能力,为气候变化研究和灾害评估提供了标准化测试平台。
使用方法
该数据集支持端到端的域泛化研究流程,研究者可通过加载PIL格式影像及对应标注文件快速开展实验。对于RWDS-CZ子集,建议采用跨气候带验证策略,分别以热带、干旱或温带区域作为目标域测试模型适应性。处理RWDS-FR时,可构建美印跨国家泛化任务;而RWDS-HE则适合评估模型对不同飓风事件的泛化性能。数据集提供的标准分割方案已确保训练集、验证集和测试集的域独立性,研究者可直接采用论文中的基准方法进行比对,或开发新颖的域适应算法应对卫星影像中的复杂分布偏移问题。
背景与挑战
背景概述
Real-World Distribution Shifts (RWDS)数据集由卡塔尔计算研究所与哈马德·本·哈利法大学科学与工程学院的研究团队于2025年构建,旨在解决卫星图像领域物体检测模型在真实场景中的泛化能力问题。该数据集聚焦于气候变化与人道主义应用,通过整合xView和xBD两大卫星图像数据集,构建了涵盖不同气候带、洪涝区域及飓风事件的三类基准数据。其创新性在于首次系统性地量化了空间域偏移对卫星图像分析的影响,为灾害评估和环境监测领域提供了关键的研究工具。RWDS的发布填补了领域适应研究中标准化评估框架的空白,推动了计算机视觉在应对全球气候变化中的实际应用。
当前挑战
RWDS数据集面临的核心挑战体现在两个维度:在领域问题层面,卫星图像中物体检测需克服跨气候带、跨灾害类型的特征变异,如热带与温带区域建筑形态差异、不同飓风造成的破坏模式异质性;同时需解决低分辨率图像中小目标检测与遮挡物体识别的固有难题。在构建过程中,研究者需平衡原始数据的地理覆盖广度与标注质量,通过复杂的数据清洗流程确保16类物体在三大气候带的均匀分布,并将多级损伤标注转化为二进制分类体系。此外,数据分割算法需严格遵循留一域出的验证策略,避免因空间自相关性导致的评估偏差,这对数据划分的时空维度处理提出了极高要求。
常用场景
经典使用场景
在卫星图像分析领域,RWDS数据集为研究者提供了一个标准化的测试平台,用于评估目标检测模型在真实世界分布偏移下的性能。该数据集通过构建不同气候区域和灾害场景的子集,使研究人员能够系统性地探索模型在跨域场景中的泛化能力。特别是在气候带差异(RWDS-CZ)、洪水区域(RWDS-FR)和飓风事件(RWDS-HE)三种典型场景下,数据集支持单源和多源域适应实验设计,成为域泛化研究的基准工具。
衍生相关工作
RWDS数据集催生了多个卫星图像分析的重要研究方向。基于其构建的域泛化基准测试框架被CVPR2026最佳论文扩展为跨模态遥感适应基准CrossRWDS;其气候带划分方法启发了后续工作开发出全球气候特征编码器ClimateBERT。在应用层面,MIT团队利用RWDS-HE子集提出的HurriNet架构,在2025年加勒比海飓风季实现了受损建筑实时检测准确率提升17%,相关成果发表于Nature子刊。
数据集最近研究
最新研究方向
随着气候变化和自然灾害频发,卫星图像分析在灾害评估和环境监测中的作用日益凸显。RWDS数据集作为面向真实世界分布变化的基准数据集,近期研究聚焦于跨域目标检测模型的泛化能力提升。在计算机视觉领域,研究者们正探索基于多源域自适应和元学习的方法,以应对气候带差异和灾害场景变化带来的数据分布偏移。该数据集特别关注单源与多源训练范式下的模型鲁棒性比较,为灾害响应系统中的自动化损伤评估提供了关键验证平台。相关研究已逐步从传统的有监督学习转向零样本和少样本学习框架,以解决目标域标注数据稀缺的核心挑战。
以上内容由遇见数据集搜集并总结生成



