LADI v2
收藏arXiv2024-06-05 更新2024-06-17 收录
下载链接:
https://huggingface.co/datasets/MITLL/LADI-v2-dataset
下载链接
链接失效反馈官方服务:
资源简介:
LADI v2(低空灾难影像数据集版本2)由美国联邦紧急事务管理署(FEMA)的民间空中巡逻队(CAP)创建,包含约10,000张美国境内多角度、多灾害类型的灾难后低空航拍图像。这些图像由受过FEMA初步损害评估流程培训的CAP志愿者进行高质量的多标签分类标注。数据集旨在支持计算机视觉模型的发展,以识别和评估灾难后的损害情况,提高应急管理操作的效率和效果。LADI v2特别强调了训练和测试集之间的真实分布变化,为评估领域适应技术提供了宝贵的基准。
LADI v2 (Low-Altitude Disaster Imagery Dataset Version 2) was created by the Civil Air Patrol (CAP) under the United States Federal Emergency Management Agency (FEMA). It contains approximately 10,000 post-disaster low-altitude aerial images across the United States, featuring multiple viewing angles and diverse disaster types. These images were annotated with high-quality multi-label classifications by CAP volunteers who received training on FEMA's preliminary damage assessment procedures. The dataset is designed to support the development of computer vision models for identifying and assessing post-disaster damage, thereby improving the efficiency and effectiveness of emergency management operations. Notably, LADI v2 places special emphasis on the realistic distribution shift between the training and test sets, serving as a valuable benchmark for evaluating domain adaptation techniques.
提供机构:
麻省理工学院林肯实验室
创建时间:
2024-06-05
搜集汇总
数据集介绍

构建方式
在灾害应急管理领域,高质量标注数据的稀缺性制约了计算机视觉模型的开发与应用。LADI v2数据集通过系统化流程构建,其图像源自美国民用空中巡逻队在2015年至2023年间响应联邦宣布的紧急事件时采集的航空照片。研究团队依据联邦紧急事务管理局的公开灾害声明数据,筛选出灾害发生14天内且在受影响县域范围内拍摄的图像,确保了数据的时效性与地理相关性。标注工作由46名经过FEMA初步损害评估培训的志愿者执行,每张图像由三人独立标注,并通过多数表决机制确定最终标签,从而保障了标注的一致性与专业性。
特点
该数据集在灾害影像分析领域展现出多方面的独特性。其图像涵盖俯视与倾斜视角,覆盖飓风、洪水、火灾等多种灾害类型,地理分布遍及美国多个州,提供了丰富的视觉多样性。标注体系基于FEMA的损害评估标准,定义了建筑物受影响、轻微损坏、严重损坏与毁坏等多个等级,并包含桥梁、道路、树木等基础设施与自然元素的损坏标签,形成了包含12个类别的多标签分类体系。尤为突出的是,数据集的训练集与测试集之间存在真实的分布偏移,反映了不同年份灾害类型的变化以及沃尔多航空相机系统等新技术引入带来的数据分布演变,为领域自适应研究提供了宝贵的基准。
使用方法
为支持灾害应急管理的研究与应用,LADI v2数据集及其预训练模型已通过GitHub和Hugging Face平台开源。研究者可直接下载该数据集,用于训练或评估针对低空灾害影像的多标签分类模型。数据集已划分为训练集、验证集和测试集,便于进行模型开发与性能验证。同时,研究团队提供了基于BiT-50和Swin v2架构的两个预训练基线分类器,用户可将其作为起点进行微调,以适应特定的下游任务。该数据集还可用于评估模型在应对年度灾害分布变化和技术演进所带来的分布偏移时的鲁棒性,推动计算机视觉在应急响应领域的实用化发展。
背景与挑战
背景概述
在自然灾害应急管理领域,基于机器学习的计算机视觉模型展现出巨大潜力,能够有效支持灾后评估与响应决策。然而,现有训练数据在低空多视角、多灾种航空影像方面存在显著缺口,制约了相关模型的开发与应用。为此,麻省理工学院林肯实验室的研究团队于2024年发布了LADI v2(低空灾害影像第二版)数据集。该数据集由美国民用空中巡逻队(CAP)在2015年至2023年联邦宣布的紧急事件中采集,包含约一万张经过精心筛选的灾后航空图像,并由经过专业训练的CAP志愿者依据联邦应急管理局(FEMA)的损害评估标准进行了多标签标注。LADI v2不仅涵盖了多种灾害类型、地理区域与拍摄视角,其标注质量与操作相关性均得到显著提升,为灾害响应中的计算机视觉研究提供了高质量、开放可用的基准资源,推动了应急管理领域智能化分析工具的发展。
当前挑战
LADI v2数据集旨在解决灾后航空影像多标签分类问题,其核心挑战在于模型需准确识别图像中多种灾害相关要素(如建筑物损坏、洪水、 debris等)及其组合,以支持快速灾情评估。这一任务面临图像内容复杂、标签共现模式多样、以及灾害场景动态变化等难题。在数据集构建过程中,研究人员遭遇了多重挑战:首先,确保标注质量与操作一致性,需依赖经过FEMA培训的志愿者进行标注,并设计符合应急管理实际需求的标签体系;其次,数据分布存在显著偏移,训练集与测试集在灾害类型、地理分布及影像采集技术(如WaldoAir系统的使用增加)上呈现年度差异,这模拟了真实灾害响应中的分布变化,但对模型的领域适应能力提出了更高要求;此外,某些灾害类型与地理区域在数据中代表性不足,可能影响模型的泛化性能。
常用场景
经典使用场景
在应急管理领域,低空航拍图像是灾后评估的关键信息来源。LADI v2数据集通过提供多视角、多灾害类型的标注图像,为计算机视觉模型在灾害响应中的经典应用场景奠定了数据基础。该数据集常用于训练和评估多标签分类模型,以自动识别图像中的关键元素,如建筑物损坏、洪水、道路损毁等,从而支持快速筛选海量航拍图像,提升灾后信息提取的效率。
解决学术问题
LADI v2数据集针对灾害影像分析中训练数据稀缺的学术难题提供了解决方案。它弥补了现有数据集中低空多视角图像不足的缺口,并通过专业标注确保了标签与FEMA损害评估标准的一致性。该数据集促进了领域自适应技术的研究,因其训练集与测试集之间存在真实的分布偏移,反映了灾害类型、操作技术和年度变化的影响,为机器学习模型在动态环境中的鲁棒性评估提供了重要基准。
衍生相关工作
围绕LADI v2数据集,已衍生出一系列经典研究工作。例如,基于Swin v2和BiT-50架构的预训练分类器在性能上超越了开源视觉语言模型LLaVA-NeXT,并与商业模型GPT-4o形成竞争。这些模型不仅作为基准推动了灾害影像分类算法的进步,还启发了对分布偏移、领域自适应以及CLIP空间语义相似性分析等机器学习子领域的深入探索,为后续灾害视觉理解系统的开发提供了重要参考。
以上内容由遇见数据集搜集并总结生成



