ShyamGhatage/EIDSeg

Name: ShyamGhatage/EIDSeg
Creator: ShyamGhatage
Published: 2026-04-30 19:00:38
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/ShyamGhatage/EIDSeg

下载链接

链接失效反馈

官方服务：

资源简介：

EIDSeg是一个大规模的地震后基础设施损坏分割数据集，收集自2008年至2023年的九次大地震。该数据集以CVAT XML格式提供原始数据，并包含相应的图像，按训练集和验证集组织。数据集包含6个类别：未损坏建筑、损坏建筑、碎片、未损坏道路、损坏道路和背景/未指定。数据集旨在用于解析XML标注和训练分割模型，并提供了详细的基准测试结果。

EIDSeg is a large-scale post-earthquake infrastructure damage segmentation dataset collected from nine major earthquakes (2008–2023). This repository provides the raw dataset in CVAT XML format, along with the corresponding images organized by split. It includes 6 classes: UD_Building, D_Building, Debris, UD_Road, D_Road, and void (Background / Undesignated). The dataset is intended to be used together with our official codebase for parsing XML annotations and training segmentation models, and detailed benchmark results are provided.

提供机构：

ShyamGhatage

搜集汇总

数据集介绍

构建方式

EIDSeg是一个专为震后基础设施损毁评估而构建的像素级语义分割数据集，其数据源自2008年至2023年间发生的九次重大地震事件中的社交媒体图像。在构建过程中，首先从公开社交平台大规模采集与地震灾情相关的视觉资料，随后进行严格筛选与质量评估，确保图像内容清晰且与基础设施损伤相关。标注工作采用CVAT工具以多边形形式逐像素勾勒出六类语义区域，包括未损毁建筑、损毁建筑、废墟、未损毁道路、损毁道路以及背景/未指定区域，形成了一套结构化的XML格式标注文件。最终，数据集被划分为训练集与验证集，并按标准目录组织图像与标注文件，便于后续深度学习模型的加载与解析。

使用方法

使用EIDSeg数据集时，推荐通过huggingface_hub库的snapshot_download函数直接下载完整数据包，亦可从HuggingFace仓库手动获取。数据采用CVAT标准格式组织，训练与验证阶段需分别解析train.xml与val.xml文件，提取其中的多边形顶点坐标与类别标签，并将其转换为密集的像素级掩码。用户可依据官方代码库中的示例脚本，将多分类标注映射至预定义的六类索引，并结合图像数据构建训练流水线。该数据集兼容主流的语义分割框架，如DeepLabV3+、SegFormer及Mask2Former等，并支持Cityscapes或ADE20K预训练权重的微调策略，以提升在震害评估任务中的分割精度。

背景与挑战

背景概述

EIDSeg是由Huili Huang等人于2025年创建的一个面向震后基础设施损伤评估的像素级语义分割数据集，相关机构包括Georgia Institute of Technology等。该数据集从2008至2023年间发生的九次重大地震事件中收集社交媒体图像，旨在解决地震灾害应急响应中基础设施损伤快速评估的数据匮乏问题。其核心研究问题在于如何通过细粒度分割实现对倒塌建筑、废墟、受损道路等关键要素的自动识别，从而为灾后救援与资源调度提供准确的空间情报。EIDSeg的发布填补了现有灾害数据集在像素级标注与多类别损伤划分上的空白，对推动计算机视觉在防灾减灾领域的应用具有重要价值，并已在多个先进分割模型上建立了基准性能。

当前挑战

EIDSeg所面临的挑战主要源于两个方面。其一，在领域问题层面，震后图像具有高度场景复杂性，包括碎片遮挡、光照不均、视角多样以及不同地震事件间建筑风格与损伤模式的显著差异，使得模型在泛化至新灾情时性能下降。其二，在数据集构建过程中，从海量社交媒体图像中筛选有效样本、对六类地物进行精确的多边形标注（含背景无关区域）、以及处理CVAT XML格式的跨平台转换均需大量人力与细粒度质量控制。此外，如何平衡各类别样本数量不均（如受损建筑与完好道路的分布差异）以降低模型偏差，也是构建中的关键难点。

常用场景

经典使用场景

EIDSeg数据集是首个面向震后基础设施损伤评估的像素级语义分割数据集，汇集了2008至2023年间九次重大地震的灾后影像。其经典使用场景聚焦于建筑物与道路的受损状态识别，涵盖未损与损毁建筑物、废墟、未损与损毁道路等六类细粒度标签。研究者可以基于该数据集训练高精度分割模型，实现对灾后航拍或社交媒体图像的自动化解析，从而快速描绘出受灾区域的损伤分布图，为救援响应与灾情研判提供精确的视觉依据。

解决学术问题

长期以来，震后损伤评估依赖人工巡查或遥感影像的粗粒度分析，缺乏公开、标准化且带有精细语义标签的地面图像数据集，制约了深度学习在该领域的应用发展。EIDSeg直面这一学术空白，通过构建大规模像素级标注语料库，系统性地推动了灾害场景下语义分割任务的研究。该数据集的出现使得学者能够量化评估各类分割模型在复杂废墟背景下的表现，探索多类别交并比平衡、小目标损伤检测等关键难题，极大促进了对极端环境视觉理解的理论深化。

实际应用

在实际应用中，EIDSeg赋能了智能化的震后应急响应体系。基于此数据集训练的模型可直接部署于无人机巡检或移动端App，对现场采集图像进行实时损伤分类与定位，辅助救援队伍精准调配资源。例如，识别出损毁道路区域以规划最短安全路径，或统计建筑物倒塌比例用于灾损评估与保险理赔。此外，该数据集还能与地理信息系统融合，生成动态灾害地图，支持政府机构与社会组织的协同决策，显著提升大规模地震应急的自动化与智能化水平。

数据集最近研究