five

CRASAR-U-DROIDs

收藏
arXiv2024-07-25 更新2024-07-27 收录
下载链接:
https://huggingface.co/datasets/CRASAR/CRASAR-U-DROIDs
下载链接
链接失效反馈
官方服务:
资源简介:
CRASAR-U-DROIDs数据集由德克萨斯A&M大学和佛罗里达州立大学的研究人员创建,包含52个正射影像图,覆盖67.98平方公里,涉及10次联邦宣布的灾难事件。数据集内容包括21,716个建筑多边形和损害标签,以及7,880个调整注释。数据集的创建过程包括图像采集、建筑损害评估注释和空间对齐数据的处理。该数据集主要应用于机器学习和计算机视觉技术,以提高灾难响应操作中建筑损害评估的准确性和效率。

The CRASAR-U-DROIDs dataset was created by researchers from Texas A&M University and Florida State University. It contains 52 orthophotos covering a total area of 67.98 square kilometers, and involves 10 federally declared disaster events. The dataset includes 21,716 building polygons paired with damage labels, as well as 7,880 adjusted annotations. The creation process of this dataset covers image acquisition, building damage assessment annotation, and processing of spatially aligned data. This dataset is primarily utilized for machine learning and computer vision technologies to improve the accuracy and efficiency of building damage assessment in disaster response operations.
提供机构:
德克萨斯A&M大学
创建时间:
2024-07-25
原始信息汇总

CRASAR sUAS Disaster Response Overhead Inspection Dataset

数据集概述

该数据集包含52个正射影像图,涵盖21716个建筑物多边形,收集自10种不同的灾害,总计67吉像素的图像。建筑物多边形来源于微软的美国建筑物轮廓数据集,部分由作者手动添加。每个建筑物多边形均使用联合损伤尺度进行标注,并进行了平移对齐以供模型训练。数据集按灾害级别分为训练集和测试集,其中训练集包含6种灾害,测试集包含4种灾害。

数据集结构

数据集顶层包含一个statistics.csv文件,提供数据集的汇总统计信息,以及两个文件夹:train和test。每个文件夹包含imagery(包含所有geo.tif文件)和annotations文件夹。annotations文件夹内包含两个子文件夹:alignment_adjustments和building_damage_assessment。这些文件夹中的JSON文件包含建筑物损伤评估和平移对齐所需的标注信息。

建筑物损伤评估

每个JSON文件是一个字典列表,每个字典定义一个建筑物多边形及其元数据。字段包括:

  • source:建筑物多边形的来源,可能选项为“Microsoft”(来自微软建筑物轮廓数据集)和“custom”(手动添加)。
  • id:每个建筑物多边形的唯一字符串ID。
  • label:联合损伤尺度的值,可能选项为“no damage”(无损伤)、“minor damage”(轻微损伤)、“major damage”(重大损伤)、“destroyed”(毁坏)和“un-classified”(未分类)。
  • pixels:建筑物多边形在正射影像图像素坐标空间中的坐标。
  • EPSG:4326:建筑物多边形在EPSG:4326坐标空间中的坐标。

对齐调整

每个JSON文件是一个由长度为二的二维坐标组成的线列表。第一个列表表示给定正射影像图的所有对齐调整,第二个列表表示形成一条线的两个点,描述将附近建筑物多边形与影像对齐所需的平移调整。这些平移调整通过将每个建筑物多边形应用最近的调整来实现对齐。

数据集统计

灾害名称 面积 (mi^2) 吉像素 建筑物多边形 数量 训练或测试
Hurricane Ian 12.61208547 30.7383172 14326 25 训练
Mayfield Tornado 3.251805677 9.698707535 2036 3 测试
Kilauea Eruption 2.220805735 1.121020488 385 3 训练
Hurricane Idalia 2.195681966 0.351551451 782 2 测试
Hurricane Ida 1.984446408 6.743893458 1095 5 训练
Hurricane Michael 1.396539933 9.450281054 1145 2 测试
Hurricane Harvey 1.001818793 5.075368273 1336 4 训练
Hurricane Laura 0.904199331 1.4456527 478 2 训练
Mussett Bayou Fire 0.662000808 2.164129413 129 5 测试
Champlain Towers Collapse 0.016037199 0.246084846 4 1 训练
总计 26.24542132 67.03500642 21716 52 N/A
搜集汇总
数据集介绍
main_image_url
构建方式
CRASAR-U-DROIDs数据集的构建主要分为三个步骤:影像获取、建筑物损毁评估标注和空间对齐校正。影像获取部分包括从美国十次联邦宣布的灾害中收集无人机影像,并使用Pix4D React和Agisoft Metashape软件将这些原始影像转换为正射影像。建筑物损毁评估标注部分采用联合损毁量表(JDS)进行标注,并经过两阶段的审核流程,以确保标注的准确性。空间对齐校正部分针对建筑物多边形和地理影像之间的空间对齐误差,进行了手动校正,以提升机器学习模型的性能。
使用方法
使用CRASAR-U-DROIDs数据集的方法包括:下载数据集,数据集可在https://huggingface.co/datasets/CRASAR/CRASAR-U-DROIDs获取;数据处理,根据需要将数据集划分为训练集和测试集,并对数据进行预处理;模型训练,使用数据集中的建筑物损毁标签和空间对齐标注进行机器学习模型的训练;模型评估,使用测试集评估模型在建筑物损毁评估和空间对齐任务上的性能。
背景与挑战
背景概述
随着无人机系统在灾害响应中的广泛应用,高质量的地表影像数据对于训练机器学习和计算机视觉模型至关重要。CRASAR-U-DROIDs数据集由德克萨斯农工大学计算机科学与工程学院的研究人员创建,旨在解决灾害响应中无人机影像利用不足的问题。该数据集收集了美国十次联邦宣布的灾害中的52个正射影像,覆盖面积达67.98平方公里,包含21,716个建筑多边形和损坏标签,以及7,880个调整注释。这些影像与建筑多边形对齐,以支持更精确的机器学习模型训练。CRASAR-U-DROIDs数据集是迄今为止最大的标记正射影像数据集,对灾害响应和计算机视觉领域具有重要影响力。
当前挑战
尽管CRASAR-U-DROIDs数据集在规模和实用性方面取得了显著进展,但仍然面临一些挑战。首先,数据集目前仅限于美国境内,限制了模型在不同地理区域的泛化能力。其次,数据集中的灾害类型有限,无法完全代表所有可能的灾害场景,从而影响了模型的广泛适用性。第三,无人机影像上的损坏评估标签可能无法准确反映建筑的实际损坏情况,这可能导致训练出的模型在实际情况中表现不佳。最后,数据集中仅考虑了平移对齐错误,而忽略了旋转、缩放和形状变化等因素,这可能限制了模型在处理更复杂对齐错误时的性能。
常用场景
经典使用场景
CRASAR-U-DROIDs数据集主要应用于灾害响应中的建筑损坏评估和空间对齐。该数据集包含了从十个联邦宣布的灾害中收集的52个正射影像,覆盖了67.98平方公里,并包含了21,716个建筑多边形和损坏标签,以及7,880个调整注释。这些数据被用于训练机器学习和计算机视觉模型,以实现对建筑损坏的自动评估。同时,建筑多边形已经与影像进行了空间对齐,以提供更准确的数据用于模型训练。
解决学术问题
CRASAR-U-DROIDs数据集解决了几个学术研究问题。首先,该数据集提供了大规模的sUAS正射影像数据,这对于之前缺乏此类数据的研究领域是一个重要的补充。其次,数据集使用了统一的JDS标注模式,使得将机器学习技术从卫星数据集转移到sUAS数据集成为可能。此外,该数据集是第一个明确解决空间对齐错误问题的数据集,这对于提高模型性能和实际应用具有重要意义。
实际应用
CRASAR-U-DROIDs数据集的实际应用场景包括灾害响应中的建筑损坏评估、空间对齐和无人机影像分析。该数据集可以帮助应急管理人员快速评估建筑损坏情况,从而更好地组织救援工作。此外,数据集的空间对齐功能可以用于提高无人机影像分析模型的准确性和可靠性,从而为灾害响应提供更准确的数据支持。
数据集最近研究
最新研究方向
随着无人机在灾害响应中的应用日益广泛,CRASAR-U-DROIDs数据集在建筑损坏评估和空间对齐方面的研究具有重要意义。该数据集的构建旨在解决现有无人机图像数据集在覆盖范围、多样性、标签方案和空间对齐方面的不足。最新研究利用CRASAR-U-DROIDs数据集,探索了无人机图像在灾害响应中的应用,包括利用深度学习技术进行建筑损坏评估、空间对齐和灾害场景理解。此外,该数据集还为评估和比较不同传感器平台(如卫星和无人机)上的计算机视觉/机器学习模型提供了基准,有助于推动多源数据融合和跨尺度图像管理技术的发展。
相关研究论文
  • 1
    CRASAR-U-DROIDs: A Large Scale Benchmark Dataset for Building Alignment and Damage Assessment in Georectified sUAS Imagery德克萨斯A&M大学 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作