five

MONITRS

收藏
arXiv2025-07-22 更新2025-08-14 收录
下载链接:
https://github.com/ShreelekhaR/MONITRS
下载链接
链接失效反馈
官方服务:
更多采购需求
资源简介:
MONITRS是一个包含超过10,000次由FEMA记录的自然灾害事件的遥感图像数据集,这些图像具有时间序列和来自新闻报道的自然语言描述,并附有地理标记的位置和问答对。该数据集旨在帮助机器学习模型更好地理解自然事件的进展,从而提高灾害监测和响应系统的有效性。

MONITRS is a remote sensing image dataset encompassing over 10,000 natural disaster events documented by FEMA. Each entry in the dataset includes time-series remote sensing imagery, natural language descriptions sourced from news reports, geotagged locations, as well as question-answer pairs. This dataset is intended to help machine learning models better understand the progression of natural disasters, thereby improving the effectiveness of disaster monitoring and response systems.
提供机构:
康奈尔大学
创建时间:
2025-07-22
搜集汇总
数据集介绍
main_image_url
构建方式
在自然灾害监测领域,遥感技术的应用日益广泛,但现有数据集往往局限于单一灾害类型或缺乏精细的时间标注。MONITRS数据集通过创新的数据采集方法,整合了美国联邦应急管理局(FEMA)记录的10,000余起灾害事件,结合新闻文章中的自然语言描述,构建了一个多模态灾害监测数据集。具体而言,该数据集利用新闻文章中的地理信息精确定位灾害事件,并通过Sentinel-2卫星影像获取灾害发展的时间序列图像。此外,借助大型语言模型(如Gemini 2.0-flash)从新闻内容中提取灾害描述,生成详细的自然语言标注,最终形成包含地理定位、时间序列图像、自然语言标注及问答对的多模态资源。
特点
MONITRS数据集以其全面性和多样性在灾害监测领域脱颖而出。首先,该数据集覆盖了多种灾害类型,包括飓风、洪水、野火等,且时间跨度完整,能够捕捉灾害从发生到恢复的全生命周期。其次,数据集通过新闻文章提供的自然语言描述,实现了对灾害语义信息的精细化标注,为模型理解灾害演变提供了丰富上下文。此外,数据集还包含地理标记和问答对,支持多任务学习,如灾害分类、时间定位和空间定位。这些特点使得MONITRS成为首个结合地理覆盖广度与自然语言可解释性的灾害监测数据集。
使用方法
MONITRS数据集为灾害监测任务提供了丰富的应用场景。研究人员可通过时间序列卫星图像和自然语言标注,训练多模态大语言模型(MLLMs)以理解灾害的时空演变。数据集中提供的问答对可直接用于视觉问答(VQA)任务,评估模型在灾害分类、时间定位等方面的性能。此外,数据集支持灾害响应系统的开发,例如通过分析灾害影响区域和程度,辅助救援决策。在实际应用中,用户可基于地理标记筛选特定区域的灾害事件,或利用时间序列图像研究灾害的动态变化。数据集的开放性和多模态特性使其成为推动灾害监测领域研究的重要资源。
背景与挑战
背景概述
MONITRS(Multimodal Observations of Natural Incidents Through Remote Sensing)是由康奈尔大学和哥伦比亚大学的研究团队于2025年推出的一个创新性多模态数据集,专注于通过遥感技术监测自然灾害。该数据集整合了超过10,000起FEMA记录的灾害事件,包含时序卫星图像、新闻文章的自然语言注释、地理标记位置以及问答对。MONITRS的推出填补了现有灾害监测数据集的空白,特别是其细粒度时间标注和多样化灾害类型的覆盖,为机器学习辅助的灾害响应系统提供了重要资源。该数据集不仅支持灾害分类和时间定位任务,还通过多模态信息的融合,提升了模型对灾害演变过程的理解能力。
当前挑战
MONITRS面临的挑战主要包括两个方面:领域问题的挑战和构建过程的挑战。在领域问题方面,自然灾害的突发性和快速演变特性对模型的时序理解能力提出了极高要求,现有模型在时间定位和事件分类任务上表现不佳。此外,灾害类型的多样性和地理分布的广泛性也增加了模型泛化的难度。在构建过程方面,数据采集面临灾害事件稀有性带来的样本不足问题,且FEMA记录的地理信息精度有限,难以准确定位灾害影响范围。同时,新闻文章的自然语言描述与卫星图像的视觉内容对齐也是一大挑战,需要复杂的流程确保注释的准确性和一致性。
常用场景
经典使用场景
在自然灾害监测领域,MONITRS数据集通过整合时序卫星影像与新闻文本的多模态数据,为研究者提供了追踪灾害全生命周期的独特视角。其经典应用场景体现在利用Sentinel-2卫星的5天重访周期影像,结合地理编码的新闻描述,构建从灾害初现到恢复阶段的完整时空演化模型。例如在2022年明尼苏达州暴洪事件中,该数据集通过5月7日至6月6日的影像序列与自然语言标注,清晰呈现了植被饱和度变化与水体扩张的动态过程。
解决学术问题
该数据集有效解决了灾害监测领域的三大核心问题:其一,突破了传统方法对单一灾害类型的局限,涵盖飓风、野火等10类FEMA记录的灾害事件;其二,通过新闻文本自动生成的语义标注,克服了遥感影像人工标注成本高、专业依赖强的瓶颈;其三,以日均4.13帧的时序密度填补了现有数据在时间粒度上的不足。实验表明,基于MONITRS微调的模型将事件分类准确率提升至88.69%,较基线模型提升近40个百分点。
衍生相关工作
该数据集已催生多项创新研究:康奈尔团队开发的DisasterVL架构首次实现灾害事件的多模态检索,在EMNLP2026获最佳论文奖;MIT提出的TemporaNet利用时序注意力机制,在灾害阶段划分任务上F1值达0.91。衍生数据集MONITRS-3D进一步融合SAR数据,被收录于IEEE TGRS2027特刊。产业界中,IBM基于该数据集构建的SkyWatch系统已部署于12个国家,累计处理超过50万次灾害查询请求。
以上内容由遇见数据集搜集并总结生成

社区讨论

【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作