DisasterM3
收藏Hugging Face2025-10-23 更新2025-10-24 收录
下载链接:
https://huggingface.co/datasets/Kingdrone-Junjue/DisasterM3
下载链接
链接失效反馈官方服务:
资源简介:
DisasterM3是一个面向全球尺度灾害评估和响应的多灾害、多传感器和多任务视觉语言数据集。它包含来自5大洲的26,988对双时态卫星图像和123k指令对,涵盖了36个具有重大影响的历史灾害事件,分为10种常见的自然和人为灾害。数据集支持9个与灾害相关的视觉感知和推理任务,充分利用了VLM模型的推理能力。
创建时间:
2025-10-17
原始信息汇总
DisasterM3数据集概述
数据集基本信息
- 许可证: CC BY-NC-SA 4.0
- 任务类别: 视觉问答、图像分割、图像到文本、图像分类
- 语言: 英语
- 标签: 视觉语言、遥感、灾害、多任务
- 数据集名称: 多灾害、多传感器、多任务视觉语言数据集,用于全球尺度灾害评估和响应
- 规模: 10亿至100亿参数级别
核心特征
- 多灾害: 包含36个具有重大影响的历史灾害事件,涵盖10种常见自然和人为灾害
- 多传感器: 结合合成孔径雷达(SAR)图像和光学传感器图像,应对灾害期间极端天气条件
- 多任务: 包含9个灾害相关的视觉感知和推理任务
数据规模
- 26,988对双时相卫星图像
- 123,000个指令对
- 覆盖5大洲
技术资源
- 论文: https://arxiv.org/abs/2505.21089
- 代码: https://github.com/Junjue-Wang/DisasterM3
发布记录
- 2025/10/23: 发布DisasterM3指令集
- 2025/10/17: 发布DisasterM3基准集
- 2025/09/22: 论文被NeurIPS 2025接收
基准测试
支持多种视觉语言模型评估,包括Qwen2.5 VL和InternVL3等模型
使用限制
- 仅限学术用途
- 禁止任何商业使用
致谢
基于以下优秀开源数据集构建:
- xBD数据集(许可证:CC BY-NC-SA 4.0)
- BRIGHT数据集(许可证:CC BY-NC 4.0)
搜集汇总
数据集介绍

构建方式
在遥感灾害评估领域,DisasterM3数据集通过精心策划的构建流程实现了多维度数据整合。该数据集汇集了来自五大洲的26,988组双时相卫星影像和123,000条指令对,覆盖36次重大历史灾害事件。构建过程中特别注重多传感器融合策略,在极端天气影响光学传感器成像时,引入合成孔径雷达数据以确保灾后场景的完整捕捉。数据标注工作涵盖了10类常见自然灾害和人为灾害,为多任务学习奠定了坚实基础。
特点
该数据集展现出三大显著特征:多灾种特性囊括了自然灾害与人为灾害的广泛谱系,为跨灾种泛化研究提供了丰富场景;多传感器配置突破单一数据源局限,结合光学与雷达影像的互补优势,确保在各种气象条件下的可靠观测;多任务设计精心构建了9项灾害相关视觉感知与推理任务,充分激发视觉语言模型的推理潜能,推动灾害评估技术的全面发展。
使用方法
针对该数据集的应用,研究人员可通过官方提供的基准测试代码进行模型评估。数据集支持多种视觉语言模型的性能验证,以Qwen2.5 VL和InternVL3为例,分别针对方位判断和灾情报告等不同子任务进行测试。使用过程中需注意该数据集仅限学术用途,严格禁止商业应用。研究人员可依据具体研究需求选择相应子集,通过标准化的评估流程确保实验结果的可靠性与可比性。
背景与挑战
背景概述
遥感技术在灾害应急响应领域具有关键作用,DisasterM3作为多模态灾害评估数据集于2025年由国际研究团队发布,其核心目标在于解决传统单模态遥感数据在复杂灾害场景下的局限性。该数据集整合了多时相卫星影像与语言指令对,覆盖五大洲的36类重大灾害事件,通过融合光学与合成孔径雷达数据构建跨模态感知基础,为灾害损害评估与应急决策提供重要支撑。
当前挑战
在灾害评估领域,多源异构数据的时空对齐与语义统一构成核心挑战,DisasterM3需同时处理光学与雷达影像的模态差异问题。数据集构建过程中面临极端天气导致的影像缺失难题,需通过多传感器协同采集保障数据完整性;其设计的九类视觉感知任务还需平衡灾害场景多样性与标注一致性,这对大规模跨任务标注流程提出极高要求。
常用场景
经典使用场景
在灾害遥感分析领域,DisasterM3数据集为多模态视觉语言模型提供了标准化的评估平台。该数据集通过整合双时相卫星影像与12.3万条指令对,支撑着灾害损伤评估的九大核心任务,包括建筑物损毁检测、灾害范围划定等关键场景。其独特的双时相设计使模型能够对比灾前灾后影像差异,为灾害影响量化提供了可靠的数据基础。
实际应用
在实际灾害响应中,DisasterM3支撑的模型能够快速生成灾害评估报告,指导应急资源调配。其多传感器特性确保了在云层覆盖等恶劣条件下仍能持续监测,为灾后救援决策提供实时数据支持。该技术已逐步应用于全球范围的灾害管理系统中,提升了灾害响应的时效性与准确性。
衍生相关工作
基于DisasterM3的基准特性,研究社区已衍生出多项创新工作。Qwen2.5-VL和InternVL3等先进模型在该数据集上进行了系统验证,推动了视觉语言模型在灾害分析领域的专用化发展。这些工作不仅完善了多任务联合学习的理论框架,还为跨模态灾害理解建立了新的技术范式。
以上内容由遇见数据集搜集并总结生成



