five

LADI v2 - 低空灾害多标签图像分类数据集|灾害管理数据集|计算机视觉数据集

收藏
github2024-05-18 更新2024-05-31 收录
灾害管理
计算机视觉
下载链接:
https://github.com/LADI-Dataset/ladi-overview
下载链接
链接失效反馈
资源简介:
LADI v2(Low Altitude Disaster Imagery version 2)数据集,由麻省理工学院构建,旨在支持应急管理操作,特别是在自然灾害发生后。该数据集以其丰富的多样性和高质量的标注而著称,图像来源于美国各地不同灾害类型的真实场景,包括斜视和垂直视角的航空图像,数据集包含约10,000张由美国民用航空巡逻队(CAP)在2015至2023年间响应联邦宣布的紧急情况所拍摄的灾害图像,并由训练有素的CAP志愿者进行了多标签分类注释。LADI v2数据集的应用领域主要集中在灾后响应,通过计算机视觉模型快速准确地评估灾后情况,从而提高灾害响应和恢复行动的效率。

The LADI v2 (Low Altitude Disaster Imagery version 2) dataset, constructed by the Massachusetts Institute of Technology, is designed to support emergency management operations, particularly following natural disasters. Renowned for its rich diversity and high-quality annotations, the dataset comprises images sourced from real scenarios of various disaster types across the United States, including oblique and vertical aerial views. It contains approximately 10,000 disaster images captured by the Civil Air Patrol (CAP) of the United States in response to federally declared emergencies between 2015 and 2023, with multi-label classification annotations provided by trained CAP volunteers. The primary application of the LADI v2 dataset focuses on post-disaster response, enabling rapid and accurate assessment of post-disaster conditions through computer vision models, thereby enhancing the efficiency of disaster response and recovery operations.
提供机构:
麻省理工学院
创建时间:
2019-12-14
原始信息汇总

数据集概述

数据集名称

  • LADI-v2-dataset

数据集目的

  • 用于解决计算机视觉社区中标注的灾后低空航拍图像相对缺乏的问题。
  • 帮助紧急管理机构通过高分辨率图像优先处理响应工作和执行损害评估。

数据集版本

  • LADI v1: 由NIST公共安全创新加速器项目资助,收集了超过40k张Civil Air Patrol (CAP)的图像,由众包工作者标注。
  • LADI v2: 使用经过FEMA损害评估过程培训的CAP志愿者进行标注,引入了FEMA初步损害评估尺度,包括未受损、受影响、轻微、重大、摧毁五个级别。

数据集内容

  • LADI v2: 约10k张图像,分为训练集8k张,验证集1k张,测试集1k张。图像具有地理标记,每张图像由CAP志愿者进行三重标注,使用多数投票解决分歧。
  • LADI v1: 约25k张图像,分为基础设施和损害两个任务。基础设施任务包括建筑物和道路,损害任务包括洪水、瓦砾和其他损害。

数据集配置

  • 默认配置: 使用v2a标签,图像大小调整为1800x1200。
  • 高级使用: 支持访问全分辨率图像和v1数据集,需要使用自定义数据集加载脚本。

数据集标签

  • LADI v2: 包括桥梁、建筑物、碎片、洪水、道路、树木和水等多个类别。
  • LADI v2a: 对建筑物损害类别进行了压缩,移除了桥梁损害标签。

数据集访问

预训练分类器

  • 提供基于LADI v2数据集的预训练分类器,用于下游微调和部署。

数据集支持任务

  • 多标签分类,任何数量的元素可能出现在单一图像中。

数据集结构

  • 单个示例包括图像和多个类别标签。

数据集使用

加载数据集

  • 使用datasets库加载数据集,支持默认配置和高级配置。

预训练分类器使用

  • 通过Hugging Face访问预训练分类器,用于微调和部署。

示例应用

  • 在ArcGIS Online上展示了一个示例应用,展示了分类器在实际场景中的应用。
AI搜集汇总
数据集介绍
main_image_url
构建方式
LADI v2数据集的构建旨在弥补计算机视觉领域中低空灾害后航拍图像标注的不足。该数据集通过收集来自Civil Air Patrol(CAP)的小型飞机和无人机拍摄的低空航拍图像,并由经过FEMA灾害评估流程培训的CAP志愿者进行标注。标注过程采用FEMA初步灾害评估量表,包括未受影响、受影响、轻微、严重和摧毁五个等级,以减少标注的主观性。数据集的构建还包括提供预训练分类器,以支持后续的微调和部署。
特点
LADI v2数据集的主要特点在于其高分辨率的灾害后航拍图像和经过专业培训的志愿者进行的标注。数据集包含约10,000张图像,分为训练集、验证集和测试集,其中测试集来自2023年的事件,以模拟新事件发生时的分布变化。此外,数据集提供了多种配置选项,包括不同分辨率的图像和不同版本的标签集,以满足不同应用需求。
使用方法
LADI v2数据集可通过Hugging Face平台访问,推荐使用默认配置加载数据集。对于高级用户,可通过设置特定参数访问全分辨率图像或其他版本的标签集。数据集还提供了预训练分类器,用户可根据需要进行微调或直接部署。此外,数据集的代码库中包含了用于推理、训练和微调的脚本,以及详细的教程和示例,帮助用户快速上手。
背景与挑战
背景概述
LADI v2数据集,全称为低空灾害多标签图像分类数据集,由美国国家标准与技术研究院(NIST)资助,旨在填补计算机视觉领域中低空灾后航空影像标注数据的空白。该数据集的核心研究问题是如何利用计算机视觉技术自动识别灾后影像中的关键特征,如建筑物、道路、洪水和碎片等,以辅助应急管理机构进行灾害响应和损失评估。LADI v2数据集的创建始于2020年,由Civil Air Patrol(CAP)志愿者通过FEMA的灾害评估流程进行标注,显著提升了标注质量。该数据集不仅在NIST的TRECVID挑战中得到广泛应用,还为灾后影像分类提供了坚实的基础。
当前挑战
LADI v2数据集在构建过程中面临多项挑战。首先,标注质量的一致性问题,尽管使用了经过FEMA培训的CAP志愿者,但仍存在主观性和标注不一致的情况。其次,数据集的多样性和分布问题,特别是新事件的分布变化,使得模型在新数据上的泛化能力面临考验。此外,数据集的多标签分类任务复杂,需要处理多种可能同时出现的灾害特征,增加了模型的训练难度。最后,数据集的规模和分辨率问题,高分辨率图像虽然提供了丰富的细节,但也增加了存储和处理的负担。
常用场景
经典使用场景
LADI v2数据集的经典使用场景主要集中在灾害响应和应急管理领域。通过利用低空无人机和小型飞机捕获的高分辨率图像,该数据集能够帮助应急管理机构优先处理响应工作并进行损害评估。计算机视觉技术可以自动识别包含建筑物、道路、洪水或碎片等特征的图像,从而加速灾害响应流程。
衍生相关工作
LADI v2数据集的发布催生了一系列相关研究和工作。例如,基于该数据集的预训练分类器在多个NIST TRECVID挑战中表现出色,推动了多任务视频理解和检索技术的发展。此外,该数据集还为灾害图像分析领域的深度学习模型提供了宝贵的训练资源,促进了相关算法的创新和优化。
数据集最近研究
最新研究方向
在灾害管理领域,LADI v2数据集的最新研究方向主要集中在利用高分辨率低空无人机图像进行多标签分类,以提升灾害响应和损害评估的效率。该数据集通过引入经过FEMA损害评估流程培训的志愿者进行标注,显著提高了标签的准确性和一致性。研究者们正致力于开发和优化基于深度学习的分类模型,以应对灾害图像中的复杂场景和多样化的损害类型。此外,数据集的发布也促进了跨学科的合作,特别是在计算机视觉与应急管理之间的交叉研究,旨在为实际灾害应对提供更为精准和实时的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

Global Volcano Database

全球火山数据库包含有关全球火山的信息,包括火山的位置、类型、历史喷发记录、海拔高度等详细数据。该数据集旨在为地质学家、环境科学家和应急管理机构提供有关火山活动的全面信息。

volcano.si.edu 收录

Tropicos

Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。

www.tropicos.org 收录

DALY

DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录