RealWorld Distribution Shifts (RWDS)
收藏arXiv2025-03-25 更新2025-03-27 收录
下载链接:
https://github.com/RWGAI/RWDS
下载链接
链接失效反馈官方服务:
资源简介:
RealWorld Distribution Shifts (RWDS)是一套针对人道主义和气候变化应用的三个新颖的领域泛化基准数据集,旨在研究气候区域和不同灾害及地理区域之间的领域转移。该数据集包括RWDS-CZ、RWDS-FR和RWDS-HE,分别关注气候区域、洪水受灾地区和飓风事件。数据集通过xView和xDB建筑损害评估数据集创建,包含不同气候和灾害条件下的卫星图像,用于评估对象检测模型的鲁棒性和泛化能力。
RealWorld Distribution Shifts (RWDS) is a set of three novel domain generalization benchmark datasets tailored for humanitarian and climate change applications, aiming to investigate domain shifts across climatic regions, various disasters and geographic regions. The dataset includes three subsets: RWDS-CZ, RWDS-FR and RWDS-HE, which focus on climatic regions, flood-affected areas and hurricane events respectively. Developed from the xView and xDB Building Damage Assessment Datasets, RWDS contains satellite images under diverse climatic and disaster conditions, and is used to evaluate the robustness and generalization ability of object detection models.
提供机构:
卡塔尔计算机研究所,HBKU
创建时间:
2025-03-25
搜集汇总
数据集介绍

构建方式
RealWorld Distribution Shifts (RWDS) 数据集的构建基于卫星图像中的真实世界分布偏移问题,旨在评估目标检测模型在跨气候区域和灾害事件中的泛化能力。该数据集包含三个子集:RWDS-CZ、RWDS-FR 和 RWDS-HE,分别针对气候区域、洪水区域和飓风事件。数据预处理包括地理坐标映射、类别筛选和样本平衡,确保每个子集在训练、验证和测试集上具有一致的分布。通过Köppen气候分类系统和灾害事件的地理标注,数据集有效捕捉了空间域偏移的多样性。
特点
RWDS 数据集的特点在于其真实性和多样性。数据集覆盖了热带、干旱和温带气候区域,以及不同地理区域的洪水事件和飓风事件,提供了丰富的视觉特征变化。每个子集均经过严格的样本筛选和平衡,确保类别分布的均匀性。此外,数据集还提供了详细的元数据和标注信息,支持多源和单源域泛化实验,为评估目标检测模型在复杂环境中的鲁棒性提供了标准化基准。
使用方法
RWDS 数据集的使用方法包括单源和多源域泛化实验。在单源设置中,模型仅在一个源域上训练,并在其他目标域上测试其泛化能力;在多源设置中,模型在多个源域上训练,以评估其在未见目标域上的表现。数据集支持标准的目标检测评估指标,如mAP,并提供了性能下降(PD)和调和均值(H)等额外指标。用户可以通过MMDetection工具箱进行模型训练和评估,数据集和代码已在GitHub上开源。
背景与挑战
背景概述
RealWorld Distribution Shifts (RWDS) 数据集由卡塔尔计算研究所(QCRI)和哈马德·本·哈利法大学(HBKU)的研究团队于2025年提出,旨在解决卫星图像目标检测中的现实世界分布偏移问题。该数据集聚焦于人道主义与气候变化应用场景,包含RWDS-CZ(跨气候带)、RWDS-FR(跨洪灾区域)和RWDS-HE(跨飓风事件)三个子集,首次针对空间域偏移构建标准化基准。通过柯本气候分类系统和多灾害地理数据,RWDS系统性地模拟了因气候带差异、地理区域特性及灾害类型变化导致的视觉特征变异,填补了目标检测领域在真实场景域泛化评估工具的空白。其创新性在于将传统独立同分布假设下的检测任务扩展至非平稳环境,对遥感影像分析、灾害响应等领域的模型鲁棒性研究具有重要推动意义。
当前挑战
RWDS数据集面临双重挑战:在领域问题层面,需解决卫星图像中因气候带差异(如热带与温带地表特征变异)、灾害类型多样性(如洪水与飓风的结构损伤模式差异)导致的跨域目标检测性能退化问题,传统检测模型在此类空间域偏移下平均精度下降达35%-65%;在构建技术层面,需克服全球尺度卫星数据覆盖不均衡(如干旱气候带样本稀缺)、跨域类别对齐(保留16个共有类别)以及灾害数据标注一致性(如将四级建筑损伤转化为二分类)等难题。此外,数据集的多元分布特性对现有域泛化方法提出新要求,如多源训练中出现的ID性能与OOD泛化能力权衡问题,以及基础模型在极端天气场景下的开放集适应挑战。
常用场景
经典使用场景
RealWorld Distribution Shifts (RWDS) 数据集在卫星图像领域被广泛应用于评估目标检测模型在真实世界分布偏移下的泛化能力。该数据集通过模拟不同气候区域(如热带、干旱和温带)以及不同自然灾害(如洪水和飓风)的场景,为研究者提供了丰富的测试环境。经典使用场景包括训练模型在一个气候区域的数据上,然后评估其在其他气候区域或不同灾害条件下的表现,以验证模型的跨域适应能力。
实际应用
RWDS 数据集的实际应用场景包括灾害评估、气候变化监测和人道主义救援。例如,在洪水或飓风灾害发生后,快速准确地评估建筑物损坏情况对于救援和重建至关重要。通过利用RWDS数据集训练的模型,可以在不同地理区域或灾害类型中实现高效的自动化评估,显著提升灾害响应速度和准确性。此外,该数据集还可用于城市规划、环境监测等需要高精度卫星图像分析的领域。
衍生相关工作
RWDS 数据集衍生了一系列经典研究工作,特别是在域泛化和目标检测领域。基于该数据集的研究提出了多种改进模型泛化能力的方法,如多源训练策略、基于Transformer的检测模型(如DINO和Grounding DINO)以及结合基础模型(如GLIP)的开放集检测技术。这些工作不仅验证了RWDS的实用价值,还推动了卫星图像分析领域的技术进步,为后续研究提供了重要基准和参考。
以上内容由遇见数据集搜集并总结生成



