five

Sen12Landslides

收藏
Hugging Face2025-05-15 更新2025-05-16 收录
下载链接:
https://huggingface.co/datasets/paulhoehn/Sen12Landslides
下载链接
链接失效反馈
官方服务:
资源简介:
Sen12Landslides是一个大规模的时空滑坡和异常检测数据集,包含了39,556个NetCDF图像块,时间跨度为15个步骤,来源于Sentinel-1和Sentinel-2卫星。每个图像块包含了二进制滑坡掩码、高分辨率数字高程模型和丰富的元数据。此外,提供了两个特定任务的子集,分别用于监督滑坡检测和异常检测。

Sen12Landslides is a large-scale spatiotemporal landslide and anomaly detection dataset, which contains 39,556 NetCDF image patches spanning 15 temporal steps and is derived from Sentinel-1 and Sentinel-2 satellite data. Each image patch includes binary landslide masks, high-resolution digital elevation models (DEM) and rich metadata. Additionally, two task-specific subsets are provided for supervised landslide detection and anomaly detection tasks respectively.
创建时间:
2025-05-13
原始信息汇总

Sen12Landslides数据集概述

数据集基本信息

  • 名称: Sen12Landslides
  • 许可证: CC-BY-4.0
  • 类型: 多传感器卫星基准数据集
  • 用途: 滑坡和异常检测的时空分析
  • 数据量: 39,556个NetCDF补丁(128×128像素,10米分辨率)
  • 时间步长: 15个时间步
  • 标注数量: 超过75,000个标注滑坡多边形和12,000+个多时相图像补丁

数据来源与内容

  • 卫星数据:
    • Sentinel-1: VV和VH波段(升轨/降轨)
    • Sentinel-2: 10个光谱波段(B02–B12)
  • 附加数据:
    • 二进制滑坡掩膜
    • 高分辨率数字高程模型(DEM)
    • 丰富元数据(事件日期、触发类型、地理位置等)

任务子集

  • S12LS-LD: 用于监督式滑坡检测
  • S12LS-AD: 用于异常检测

数据结构

  • 主文件夹:

    • s1asc/: 包含13个.tar.gz文件(升轨Sentinel-1数据)
    • s1dsc/: 包含12个.tar.gz文件(降轨Sentinel-1数据)
    • s2/: 包含28个.tar.gz文件(Sentinel-2数据)
    • inventories.shp.zip: 包含官方滑坡多边形标注
  • 文件命名模式:

    <region><sensor><id>.nc 例如: italy_s2_6982.nc

  • NetCDF文件内容:

    • 多时相影像
    • 二进制滑坡掩膜(MASK
    • 元数据(事件日期、前后索引等)
    • Sentinel-2文件可能包含DEM和云掩膜(SCL)

元数据示例

  • 属性:
    • ann_id: 标注ID列表
    • ann_bbox: 标注边界框
    • event_date: 事件日期
    • date_confidence: 日期置信度
    • pre_post_dates: 前后日期索引
    • annotated: 是否标注
    • satellite: 卫星来源(s1或s2)
    • center_lat: 中心纬度
    • center_lon: 中心经度
    • crs: 坐标参考系统

下载方式

bash huggingface-cli repo clone paulhoehn/Sen12Landslides --repo-type dataset /path/to/your/folder

注意事项

  • 数据集内容和结构可能在论文接受后更新。
  • 预处理脚本和数据加载器可在GitHub仓库获取:https://github.com/PaulH97/Sen12Landslides
搜集汇总
数据集介绍
main_image_url
构建方式
Sen12Landslides数据集通过整合Sentinel-1和Sentinel-2卫星的多源遥感数据,构建了一个大规模时空滑坡检测基准。数据采集覆盖15个时间步长,形成39,556个128×128像素的NetCDF格式图像块,空间分辨率达10米。每个数据块不仅包含VV/VH波段(Sentinel-1)和10个光谱波段(Sentinel-2),还融合了数字高程模型、二值滑坡掩膜及事件日期、触发类型等元数据。标注过程采用75,000余个滑坡多边形作为地面实况,通过严格的空间对齐确保数据精度。
使用方法
使用该数据集时需通过HuggingFace CLI工具克隆仓库,解压后按卫星传感器(s1asc/s1dsc/s2)分类访问数据。每个NetCDF文件可通过xarray库读取,内含时空坐标轴、多波段影像矩阵及附属标签。研究人员可利用预置的MASK字段进行端到端模型训练,或结合DEM数据开发地形特征增强算法。配套GitHub仓库提供数据加载器和预处理脚本,支持快速构建基于PyTorch或TensorFlow的训练流程。对于异常检测任务,建议利用pre_post_dates元数据划分事件前后期影像序列。
背景与挑战
背景概述
Sen12Landslides数据集由PaulH97团队构建,旨在为基于卫星影像的滑坡与异常检测研究提供大规模、多传感器的时空基准数据。该数据集整合了Sentinel-1和Sentinel-2卫星的多模态遥感数据,包含39,556个128×128像素的NetCDF格式影像块,覆盖15个时间步长,并辅以数字高程模型(DEM)和详尽的元数据标注。其核心研究问题聚焦于如何利用多源遥感数据实现高精度的滑坡自动识别与异常监测,为地质灾害预警系统提供可靠的数据支持。该数据集的发布显著推动了遥感与计算机视觉交叉领域的发展,尤其在多时相、多模态地理空间数据分析方面具有里程碑意义。
当前挑战
Sen12Landslides数据集面临的挑战主要体现在两方面:其一,在领域问题层面,滑坡检测受限于复杂地形环境下光学与SAR影像的噪声干扰、季节性植被覆盖变化导致的误检,以及小规模滑坡在10米分辨率下的识别困难;其二,在构建过程中,团队需克服多源卫星数据时空对齐的精度问题、跨15个时间步长的数据一致性校验,以及全球范围内75,000余个滑坡多边形标注的质量控制。此外,NetCDF格式的多维数据存储与高效访问机制的设计,亦成为技术实现上的关键难点。
常用场景
经典使用场景
Sen12Landslides数据集作为多模态遥感影像的基准数据集,在滑坡检测领域具有重要价值。其经典使用场景包括利用Sentinel-1和Sentinel-2的多时相影像数据,结合高分辨率数字高程模型,通过深度学习模型进行滑坡区域的精确识别与定位。该数据集特别适合用于训练和评估时序变化检测算法,为地质灾害监测提供可靠的数据支撑。
解决学术问题
该数据集有效解决了滑坡检测领域长期存在的数据稀缺问题,为学术界提供了标准化的大规模标注样本。通过融合SAR与光学遥感数据,显著提升了复杂地形条件下滑坡识别的准确性,推动了多源遥感数据融合、时序异常检测等关键技术的研究进展,对地质灾害预警系统的开发具有重要科学意义。
实际应用
在实际应用中,Sen12Landslides数据集已被多个国家和地区的地质灾害管理部门采用,用于构建自动化滑坡监测系统。其高时空分辨率的特性使得早期识别滑坡风险成为可能,为应急响应和灾害评估提供了关键数据支持,显著提升了灾害管理的时效性和准确性。
数据集最近研究
最新研究方向
随着遥感技术和深度学习方法的快速发展,Sen12Landslides数据集在地质灾害监测领域展现出巨大潜力。该数据集融合了Sentinel-1 SAR数据和Sentinel-2多光谱影像,结合高精度数字高程模型,为滑坡检测研究提供了前所未有的多模态时空基准。当前研究热点集中在开发端到端的时空深度学习架构,利用Transformer和3D CNN等模型挖掘时序特征与空间特征的关联性,提升滑坡早期预警能力。同时,该数据集正推动异常检测算法在未标记区域的泛化性能研究,特别是在极端气候事件频发的背景下,对突发性地质灾害的快速响应机制具有重要实践价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作