five

SWIFTT-bark_beetle_detection_semantic_segmentation

收藏
Hugging Face2026-04-21 更新2026-04-22 收录
下载链接:
https://huggingface.co/datasets/AnnalisaAppice/SWIFTT-bark_beetle_detection_semantic_segmentation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为研究树皮甲虫检测而开发的语义分割卫星影像数据集,属于SWIFTT项目(卫星荒野检查与森林威胁追踪)的一部分。数据集包含Sentinel-2和Sentinel-1的标记卫星影像,用于开发和评估预测模型,以检测和绘制欧洲云杉林中由树皮甲虫引起的森林损害。数据集覆盖捷克共和国(2020年9月)、法国东北部(2018年10月)和罗马尼亚(2020年9月)的区域。数据创建采用两种方法:最佳可用图像(基于云指数选择)和时间中值(基于月度时间窗口中每个波段的中值计算)。数据集结构包括卫星影像、雷达数据(可选)、统计信息和地面真实掩码。数据格式为GeoTIFF(地理参考),空间分辨率为10米,使用EPSG:3857坐标系。数据集仅限非商业用途,适用于科学研究、教育和算法开发。
创建时间:
2026-04-16
原始信息汇总

Bark Beetle Detection - Semantic Segmentation Dataset (SWIFTT Project) 数据集概述

数据集基本信息

  • 许可证: CC BY-NC-SA 4.0
  • 主要用途: 研究
  • 核心任务: 语义分割
  • 应用领域: 森林监测、遥感

数据集描述

该数据集用于基于卫星影像的语义分割来检测树皮甲虫。专为研究目的开发。

数据内容与特征

  • 卫星影像: 包含哨兵2号(Sentinel-2)和哨兵1号(Sentinel-1)影像。
  • 地面实况掩膜: 提供用于训练和测试的标注掩膜。
  • 森林类型分类: 包含可选的数据。
  • 数据格式: 卫星影像和掩膜均为GeoTIFF格式。掩膜为单波段,值0代表负类,1代表正类。

地理与时间覆盖范围

  • 捷克共和国: 2020年9月,用于树皮甲虫检测和森林类型分类。
  • 法国东北部: 2018年10月,用于树皮甲虫检测。
  • 罗马尼亚: 2020年9月,用于树皮甲虫检测。

数据创建方法

数据集通过以下两种方法之一创建:

  1. 最佳可用影像法:
    • 基于云指数指标,从月度时间窗口中选择质量最高的完整哨兵2号影像。
    • 包含13个波段:重采样至10米分辨率的哨兵2号光谱波段(B1-B9, B11, B12,不包括B10)、SCL波段,以及(可选的)同址哨兵1号波段(VV和VH)。
    • 优点:辐射质量高,云覆盖和缺陷像素最少,无合成伪影。
    • 适用于:捷克共和国(2020年9月,哨兵1号和2号)、法国东北部(2018年10月,哨兵1号和2号)的区域。
  2. 时间中值法:
    • 在月度时间窗口内,为每个波段计算中值,并在计算中值时掩蔽云覆盖。
    • 包含12个波段:重采样至10米分辨率的哨兵2号光谱波段(不包括SCL波段和B10波段)。
    • 优点:时间稳定性好,减少伪影,有效掩蔽云层。
    • 适用于:捷克共和国(2019年9月,2020年4月至9月)、罗马尼亚(2020年4月至9月)的区域。

数据集结构

数据集按国家组织,目录结构包含“树皮甲虫”和“森林类型”部分,其下按处理方法、时间周期划分,包含卫星影像、掩膜(训练/测试)等文件夹。

技术处理细节

  • 数据源: 来自Microsoft Planetary Computer或Google Earth Engine。
  • 空间分辨率: 统一重采样至10米。
  • 坐标系: EPSG:3857(Web Mercator)。
  • 哨兵2号波段: 包含B1-B9、B11、B12共12个波段。B10波段被排除。
  • 辐射校正: 所有哨兵2号影像使用Level 2A地表反射率产品。所有哨兵1号影像使用Level-1 RTC产品。

许可信息

  • 许可证类型: 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可证。
  • 允许用途: 非商业使用、科学研究、教育。
  • 禁止用途: 未经授权的商业使用。

项目与支持

  • 所属项目: SWIFTT项目(用于荒野检查和森林威胁跟踪的卫星)。
  • 资金支持: 由欧盟根据赠款协议101082732资助。
搜集汇总
数据集介绍
main_image_url
构建方式
在森林遥感监测领域,SWIFTT数据集通过系统化的卫星影像处理流程构建而成。其核心采用两种科学方法:一是基于云指数指标从月度时间窗口筛选出质量最优的完整哨兵二号影像,确保影像具备卓越的辐射质量与最小化云层干扰;二是通过月度时间窗口内各波段的掩膜中值计算,生成具有时间稳定性的合成影像,有效减少单一影像的云覆盖与伪影影响。所有影像均经过大气校正与地形辐射校正,并统一重采样至10米空间分辨率,坐标系统一为EPSG:3857,为语义分割模型训练提供了高一致性的数据基础。
特点
该数据集聚焦于欧洲云杉林中小蠹虫灾害的检测,其显著特点体现在多源数据融合与精细标注上。数据集整合了哨兵二号的多光谱影像与哨兵一号的合成孔径雷达数据,提供了丰富的光谱与纹理信息。地理覆盖范围涵盖捷克、法国东北部及罗马尼亚的特定区域,并附有不同时间段的观测数据,支持时空分析。所有影像均配有像素级的地面真实掩膜,清晰标注了受虫害影响的林区,同时部分区域还提供了森林类型分类的辅助标注,为模型训练与验证提供了多维度的监督信息。
使用方法
该数据集专为研究目的设计,主要用于训练和验证语义分割模型,以实现对小蠹虫引发的森林树冠枯死现象的自动识别与制图。使用者可按照数据集提供的分层目录结构,分别加载训练与测试集的卫星影像及其对应的二值掩膜。影像以地理配准的GeoTIFF格式存储,可直接输入深度学习框架进行端到端训练。研究人员可结合不同区域(捷克、法国、罗马尼亚)与不同处理方法(最佳影像法、时间中值法)的数据,评估模型在不同地理与时间条件下的泛化能力与鲁棒性。
背景与挑战
背景概述
在森林生态监测领域,树皮甲虫侵染导致的森林衰退已成为全球性生态威胁,亟需高效、大范围的监测手段。SWIFTT项目数据集应运而生,由欧盟资助的SWIFTT研究团队于2020年至2026年间创建,旨在利用Sentinel系列卫星影像,通过语义分割技术自动检测欧洲云杉林中的树皮甲虫损害。该数据集覆盖捷克、法国东北部及罗马尼亚等区域,整合了多光谱与雷达数据,为遥感算法与人工智能模型的发展提供了关键支撑,显著推动了森林威胁自动化监测的研究进程。
当前挑战
该数据集致力于解决森林损害语义分割中的核心挑战,包括如何在复杂地形与多变光照条件下精确区分健康与受损林区,以及如何处理卫星影像中常见的云层遮挡与时空异质性。在构建过程中,研究团队面临数据质量控制的难题,例如需通过最佳影像选择与时间中值聚合等方法优化云掩膜,并确保多源数据在空间分辨率与坐标系统上的统一,同时还需在非商业许可框架下平衡数据的开放性与使用限制。
常用场景
经典使用场景
在森林生态监测领域,SWIFTT-bark_beetle_detection_semantic_segmentation数据集为语义分割模型提供了关键训练与验证资源。该数据集整合了Sentinel-2与Sentinel-1卫星影像,并辅以精细标注的地面真值掩码,使研究者能够开发高精度算法,自动识别云杉林中由树皮甲虫侵害引发的树木枯死现象。通过采用最佳可用影像与时间中值两种处理方法,数据集确保了影像质量的稳定性与时空连续性,为模型在复杂森林环境下的泛化能力评估奠定了坚实基础。
解决学术问题
该数据集有效应对了遥感生态学中树皮甲虫灾害自动监测的学术挑战。传统监测方法依赖人工实地勘察,耗时费力且难以实现大范围实时追踪。本数据集通过提供多时相、多光谱的标注卫星影像,支持研究者探索基于深度学习的语义分割模型,解决灾害早期识别、损害程度量化及空间分布制图等关键科学问题。其标注数据涵盖了捷克、法国东北部及罗马尼亚等不同地理区域,有助于验证模型在不同森林类型与气候条件下的鲁棒性,推动了森林干扰监测算法的跨区域适用性研究。
衍生相关工作
围绕该数据集已衍生出多项具有影响力的研究工作。例如,Andresini等人提出的DIAMANTE方法利用数据集中的最佳可用影像,开发了一种数据中心的语义分割框架,用于精确绘制树皮甲虫导致的树木枯死图。Recchia等人则基于时间中值处理方法,构建了ULISSE模型,实现了对地球视觉模型的高效参数适应,以监测Sentinel-2时间序列中的森林干扰。这些工作不仅验证了数据集的有效性,还推动了遥感与人工智能在生态监测领域的融合与创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作