five

BRIGHT|建筑损伤评估数据集|灾害响应数据集

收藏
arXiv2025-01-10 更新2025-01-14 收录
建筑损伤评估
灾害响应
下载链接:
https://github.com/ChenHongruixuan/BRIGHT
下载链接
链接失效反馈
资源简介:
BRIGHT数据集是一个全球分布的多模态建筑损伤评估数据集,由东京大学、RIKEN、苏黎世联邦理工学院和微软亚洲研究院联合创建。该数据集包含高分辨率的光学和SAR图像,空间分辨率在0.3至1米之间,覆盖了12个地区的5种自然灾害和2种人为灾害,特别关注发展中国家。数据集包含超过35万条建筑实例,提供了详细的建筑损伤信息,适用于精确的损伤评估。数据集的创建过程包括从多个灾害事件中收集光学和SAR图像,并进行多级标注,区分受损和完全毁坏的建筑。BRIGHT数据集的应用领域包括灾害响应、建筑损伤评估和人工智能模型的训练与评估,旨在通过全天候的灾害响应减少人员伤亡和财产损失。
提供机构:
东京大学前沿科学研究生院, RIKEN先进智能项目中心, 苏黎世联邦理工学院摄影测量与遥感系, 微软亚洲研究院
创建时间:
2025-01-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
BRIGHT数据集的构建采用了多模态地球观测数据,结合了灾前光学影像和灾后合成孔径雷达(SAR)影像。光学影像主要来自Maxar的开放数据计划,SAR影像则来自Capella Space和Umbra Space。数据经过地形校正和预处理,确保光学和SAR影像的精确配准。建筑物多边形由专家手动标注,并通过独立视觉检查确保准确性。损害标注则基于Copernicus应急管理服务和联合国卫星中心的应急制图产品,结合高分辨率光学影像的视觉解释和部分实地考察。
特点
BRIGHT数据集是全球首个开放访问的多模态建筑物损害评估数据集,涵盖了12个地区的五种自然灾害和两种人为灾害。其光学和SAR影像的空间分辨率在0.3至1米之间,能够提供单个建筑物的详细表示,适合精确的损害评估。数据集包含超过35万个建筑物实例,具有丰富的地理多样性,尤其关注发展中国家,这些地区在灾后最需要外部援助。
使用方法
BRIGHT数据集可用于训练和评估基于人工智能的建筑物损害评估模型。数据集已划分为训练集、验证集和测试集,比例为7:1:2。研究人员可以使用该数据集进行建筑物定位和损害分类任务,并通过交叉熵损失和Lovasz softmax损失函数优化模型。数据集还提供了多种深度学习模型的基准测试结果,为未来的研究提供了参考和灵感。
背景与挑战
背景概述
BRIGHT数据集是由东京大学、RIKEN先进智能项目中心、苏黎世联邦理工学院和微软亚洲研究院等机构的研究团队于2025年创建的全球首个多模态高分辨率建筑损毁评估数据集。该数据集旨在支持全天候灾害响应,特别是在自然灾害和人为灾害发生后,通过结合光学和合成孔径雷达(SAR)影像,提供精确的建筑损毁评估。BRIGHT涵盖了全球12个地区的五种自然灾害和两种人为灾害,重点关注发展中国家,这些地区在灾害后往往需要外部援助。数据集的光学和SAR影像空间分辨率在0.3至1米之间,能够详细呈现单个建筑的损毁情况,为基于人工智能的灾害响应提供了强有力的支持。
当前挑战
BRIGHT数据集面临的挑战主要包括两个方面:首先,光学影像在灾害响应中的应用受限于天气条件和光照,无法在恶劣天气或夜间提供有效数据,而SAR影像虽然能够全天候工作,但其成像机制与光学影像不同,存在视角倾斜、斑点噪声、物体遮挡和几何失真等问题,增加了建筑损毁精确评估的难度。其次,构建BRIGHT数据集的过程中,研究人员需要克服多模态影像对齐的困难,尽管通过专家手动对齐和交叉检查确保了影像的精确配准,但仍可能存在微小的对齐误差。此外,数据集的标签依赖于专家对光学影像的视觉解释,可能存在误判,导致标签噪声。最后,BRIGHT数据集在区域分布上存在不平衡,某些地区的建筑数量和影像数据量较大,可能影响模型的训练和评估效果。
常用场景
经典使用场景
BRIGHT数据集在全球范围内提供了多模态的高分辨率光学和合成孔径雷达(SAR)影像,专为支持基于人工智能的全天候灾害响应而设计。该数据集涵盖了12个地区的五种自然灾害和两种人为灾害,特别关注发展中国家。其高分辨率影像(0.3至1米)能够详细呈现单个建筑物的损坏情况,适用于精确的建筑物损坏评估。
实际应用
BRIGHT数据集的实际应用场景主要集中在灾害响应的早期阶段,特别是在建筑物损坏评估方面。通过提供高分辨率的影像数据,BRIGHT能够帮助救援人员快速识别受灾区域的建筑物损坏情况,从而指导救援行动。此外,该数据集还可用于灾后重建规划,帮助政府和国际组织评估灾害损失并制定恢复策略。
衍生相关工作
BRIGHT数据集的发布催生了一系列相关研究工作,特别是在多模态影像处理和建筑物损坏评估领域。基于BRIGHT,研究人员开发了多种先进的深度学习模型,如ChangeMamba和DamageFormer,这些模型在建筑物损坏映射任务中表现出色。此外,BRIGHT还被用于IEEE GRSS数据融合竞赛,进一步推动了多模态影像分析技术的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

OECD - Education at a Glance

该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。

www.oecd.org 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录