kate-cd
收藏Hugging Face2025-03-28 更新2025-03-29 收录
下载链接:
https://huggingface.co/datasets/CSCRS/kate-cd
下载链接
链接失效反馈官方服务:
资源简介:
KATE-CD数据集是一个用于地震损害评估变化检测算法开发和评估的数据集。它包含了土耳其Kahramanmaraş地震前后覆盖受影响地区的卫星图像对。数据集旨在通过提供高质量标注数据,帮助研究人员训练和测试用于自动化损害检测的机器学习模型。
The KATE-CD dataset is a specialized dataset for the development and evaluation of change detection algorithms used in seismic damage assessment. It includes paired satellite images covering the disaster-affected regions in Turkey, captured both before and after the Kahramanmaraş earthquake. This dataset is designed to assist researchers in training and testing machine learning models for automated damage detection by providing high-quality annotated data.
创建时间:
2025-03-27
原始信息汇总
KATE-CD 数据集概述
数据集基本信息
- 名称: Kahramanmaraş Türkiye Earthquake-Change Detection Dataset (KATE-CD)
- 用途: 地震损害评估的变化检测算法开发与评估
- 数据格式:
- 特征:
pre_image: 地震前图像 (dtype: image)post_image: 地震后图像 (dtype: image)label: 标注图像 (dtype: image)
- 数据量:
- 训练集: 404个样本,371.52 MB
- 验证集: 44个样本,40.55 MB
- 测试集: 38个样本,34.64 MB
- 总下载大小: 446.44 MB
- 总数据集大小: 446.72 MB
- 特征:
数据来源与处理
- 卫星图像来源: Maxar Open Data 和 Airbus Pleiades
- 覆盖区域: 土耳其的七个重灾区城市(Adıyaman, Gaziantep, Hatay, Kahramanmaraş, Kilis, Osmaniye, Malatya)
- 分辨率: 0.3m 至 0.5m
- 坐标参考系统: EPSG:32637
- 光谱分辨率: 8位
标注过程
- 标注工具: Label Studio
- 标注方法:
- 图像分割为512×512像素块
- 多边形标注损坏建筑物
- 二值标注策略(1表示损坏,0表示未损坏)
- 标注结果: 486对地震前后图像对
机器学习准备
- 结构化格式: 标准化目录结构,便于模型训练
- 公开平台: CodeOcean, GitHub, HuggingFace
相关资源
- 论文: "Earthquake Damage Assessment with SAMCD: A Change Detection Approach for VHR Images" (JURSE 2025)
- 代码与数据:
数据访问与使用
- HuggingFace: 提供Parquet格式数据,支持Large File Storage (LFS)
- GitHub: 提供代码和开发环境配置(不含数据)
- CodeOcean: 提供完整的数据、代码和计算环境,支持一键复现结果
搜集汇总
数据集介绍

构建方式
KATE-CD数据集聚焦于地震灾害评估领域,采用多源高分辨率卫星影像构建而成。数据来源于Maxar Open Data和Airbus Pleiades卫星系统,覆盖土耳其Kahramanmaraş地震影响的七个城市区域,影像分辨率达0.3-0.5米。通过网格化处理将原始影像分割为512×512像素的标准化图斑,运用Label Studio工具进行人工标注,采用多边形标记受损建筑物并实施二元标注策略(1表示受损/0表示未受损),最终形成486组具有时空对应关系的灾前灾后影像对。
特点
该数据集的核心价值在于其专业的地震损伤变化检测特性。所有影像均经过辐射校正并统一采用EPSG:32637坐标系统,确保不同传感器获取数据的空间一致性。数据集包含404组训练样本、44组验证样本和38组测试样本,每组数据包含灾前影像、灾后影像及二值化标注掩膜的三元结构。特别值得注意的是,数据标注过程严格遵循建筑损伤评估标准,为机器学习模型提供了精确的监督信号。
使用方法
研究者可通过HuggingFace平台直接加载Parquet格式的标准化数据,实现与主流深度学习框架的无缝对接。数据集已预分割为训练集、验证集和测试集,支持端到端的模型开发流程。对于需要完整研究环境的用户,可通过CodeOcean胶囊获取包含Docker配置的完整复现系统,使用命令`docker run`即可启动包含GPU加速的计算环境。可视化模块可生成评估指标表格和预测结果图谱,对应论文中的定量分析与定性展示需求。
背景与挑战
背景概述
KATE-CD数据集由土耳其地震后灾情评估研究团队于2025年国际城市遥感会议(JURSE)前夕发布,旨在解决高分辨率卫星影像在震害变化检测中的关键问题。该数据集聚焦2023年卡赫拉曼马拉什地震,整合了Maxar和Airbus Pleiades提供的0.3-0.5米分辨率卫星影像,覆盖7个重灾区城市。通过网格化处理和Label Studio人工标注,构建了包含486组前后时相图像对的标准化数据集,其独特的二元标注策略为建筑物损毁识别提供了精确的像素级真值参考。作为首个针对土耳其地震的开放变化检测数据集,KATE-CD显著提升了机器学习模型在灾情评估中的泛化能力,推动了遥感与灾害管理的跨学科研究进展。
当前挑战
在技术层面,KATE-CD需解决多源异构影像的辐射归一化难题,包括不同传感器、光照条件和拍摄角度导致的色彩偏差问题。数据构建过程中,人工标注面临震后复杂场景下损毁边界的模糊性判定挑战,特别是部分坍塌建筑物的精确多边形标注需要专业判读经验。算法开发方面,模型需克服小样本训练困境(仅404组训练样本),同时处理高分辨率影像中建筑物尺度差异大的特征提取问题。数据集的空间分辨率优势反而带来计算复杂度激增的副作用,要求算法在精度与效率间取得平衡。此外,跨平台(CodeOcean/GitHub/HuggingFace)数据同步时,需保持Parquet格式与原始图像的元数据一致性,这对版本控制提出了特殊要求。
常用场景
经典使用场景
KATE-CD数据集作为地震灾害评估领域的重要资源,其经典使用场景主要集中在高分辨率卫星影像的变化检测任务上。该数据集通过提供土耳其卡赫拉曼马拉什地震前后的双时相遥感影像,为研究人员构建端到端的建筑物损毁检测模型提供了标准化数据支持。512×512像素的网格化标注方案使得该数据集能够直接适配主流的卷积神经网络架构,成为深度学习算法在灾害响应领域的重要测试平台。
实际应用
在实际应用层面,KATE-CD数据集支持了应急响应系统的智能化升级。灾害管理部门可利用该数据集训练的模型,快速生成震后建筑物损毁热力图,辅助救援资源调度决策。城市安全评估机构则通过分析不同区域的损毁模式,完善区域抗震建筑规范。数据集覆盖的七个重灾城市样本,为跨国灾害联合评估提供了标准化的案例研究素材。
衍生相关工作
基于该数据集衍生的SAMCD方法在JURSE 2025会议上提出了创新的变化检测框架。多项研究利用其双时相影像特性,开发了注意力机制增强的U-Net变体模型。部分工作聚焦标注策略优化,提出了基于该数据集的半自动标注流水线。数据集的三平台发布模式(CodeOcean/GitHub/HuggingFace)也催生了多个跨平台模型部署方案的研究。
以上内容由遇见数据集搜集并总结生成



