five

Forest-Change

收藏
Hugging Face2026-01-20 更新2026-01-22 收录
下载链接:
https://huggingface.co/datasets/JimmyBrocko/Forest-Change
下载链接
链接失效反馈
官方服务:
资源简介:
Forest-Change是第一个专门为联合森林变化检测和遥感图像字幕设计的基准数据集。它提供了双时相卫星图像、像素级森林砍伐掩膜以及描述热带和亚热带地区森林覆盖变化的多粒度语义字幕。数据集包含334个标注的双时相图像对,空间分辨率约为30米/像素,原始图像大小为480×480像素,处理后调整为256×256像素。图像对之间的时间分辨率为1年,地理焦点集中在热带和亚热带森林砍伐前沿。每个示例包括变化前和变化后的RGB卫星图像、二进制分割掩膜(0=无变化,1=森林砍伐)以及五个描述森林变化事件的不同粒度字幕。数据集通过混合两阶段方法生成字幕:人工标注和基于规则的生成,确保了语义丰富性和结构一致性。数据集主要用于森林变化检测和监测、森林砍伐分割、生态应用的变化字幕、遥感多任务学习等。

Forest-Change is the first benchmark dataset specifically designed for joint forest change detection and remote sensing image captioning. It provides bi-temporal satellite images, pixel-level deforestation masks, and multi-granularity semantic captions that describe forest cover changes in tropical and subtropical regions. The dataset contains 334 annotated bi-temporal image pairs, with a spatial resolution of approximately 30 meters per pixel. The original image size is 480×480 pixels, which is resized to 256×256 pixels after processing. The temporal resolution between each image pair is 1 year, and the geographic focus is on tropical and subtropical deforestation frontiers. Each sample includes pre-change and post-change RGB satellite images, binary segmentation masks (0 = no change, 1 = deforestation), and five captions of varying granularity that describe forest change events. The captions of the dataset are generated via a hybrid two-stage approach: manual annotation and rule-based generation, which ensures semantic richness and structural consistency. The dataset is primarily used for forest change detection and monitoring, deforestation segmentation, change captioning for ecological applications, remote sensing multi-task learning, and other related tasks.
创建时间:
2026-01-19
原始信息汇总

Forest-Change 数据集概述

数据集简介

Forest-Change 是首个专门为遥感图像中的联合森林变化检测与描述而设计的基准数据集。它提供了双时相卫星图像、像素级森林砍伐掩膜以及描述热带和亚热带地区森林覆盖变化的多粒度语义描述。

数据集详情

  • 总样本数:334 个带标注的双时相图像对
  • 空间分辨率:约 30 米/像素(中等分辨率)
  • 原始图像尺寸:480×480 像素(从更大场景中裁剪)
  • 处理后图像尺寸:256×256 像素(为模型训练调整大小)
  • 时间分辨率:图像对之间间隔 1 年
  • 地理焦点:热带和亚热带森林砍伐前沿

数据划分

  • 训练集:270 个样本(约 80%)
  • 验证集:31 个样本(约 10%)
  • 测试集:33 个样本(约 10%)

数据格式

每个样本包含:

  • 图像 A:变化前的 RGB 卫星图像
  • 图像 B:变化后的 RGB 卫星图像
  • 变化掩膜:二值分割掩膜(0=无变化,1=森林砍伐)
  • 描述文本:五个描述森林变化事件、具有不同粒度的描述文本

数据来源

  • 图像来源:Google Earth Engine (GEE)
  • 基础数据集:源自 Hewarathna 等人 (2024) 的森林生态系统变化检测数据集
  • 验证:通过全球森林观察 (GFW) 平台验证森林覆盖变化
  • 地理选择:基于世界自然基金会 (WWF) 2015 年森林砍伐前沿报告

描述文本生成

描述文本通过混合两阶段方法生成:

  1. 人工标注:每个样本由领域标注者手动创建一个描述观察到的变化的描述文本。
  2. 基于规则的生成:基于定量掩膜属性自动生成四个额外的描述文本:
    • 新砍伐区域的百分比(分箱到描述性严重程度级别)
    • 单个变化斑块的大小和数量
    • 森林砍伐的空间分布模式
    • 斑块大小的变化

关键特征

  • 变化覆盖率
    • 平均值:每幅图像森林砍伐率 <5%
    • 最大值:森林砍伐率 40%
    • 分布:严重偏向较低的森林砍伐百分比
  • 描述文本长度:双峰分布,包含简洁和详细的描述
  • 变化模式:多样化的森林砍伐表现形式,包括:
    • 森林区域中分散的小斑块
    • 集中的清理区域
    • 清理边缘的扩张模式
    • 高度可变的斑块大小和配置
  • 描述文本内容:描述强调:
    • 森林丧失的程度/严重性
    • 在图像内的空间位置
    • 斑块特征(大小、数量、分布)

预处理

  • 所有图像调整为 256×256 像素以确保一致性
  • 变化掩膜二值化(0=无变化,1=变化)
  • 双时相图像对预先对齐
  • 使用数据集特定的均值和标准差统计进行逐通道归一化
  • 未应用大气校正
  • 未应用云掩膜(部分样本包含部分云遮挡)

使用场景

  • 森林变化检测与监测
  • 自然环境中的森林砍伐分割
  • 生态应用的变化描述
  • 遥感多任务学习
  • 森林图像上视觉语言模型的基准测试
  • 训练交互式森林分析系统
  • 开发自动化森林监测工作流

评估指标

由于严重的类别不平衡(大多数像素为无变化),评估需要:

  • 每类 IoU:变化类和无变化类的单独指标
  • 平均 IoU (mIoU):两个类别 IoU 的平均值
  • 描述文本指标:BLEU-n (n=1,2,3,4)、METEOR、ROUGE-L、CIDEr-D
  • 注意:由于类别不平衡,不建议使用整体准确率

局限性

  • 数据集规模:仅限于 334 个样本,限制了模型的泛化能力
  • 场景多样性:由于裁剪和增强策略,独特地理区域的数量有限
  • 类别不平衡:严重不平衡,大多数像素代表无变化,对检测模型构成挑战
  • 描述文本质量:大多数描述文本是基于规则生成的,限制了语言变异性和自然度
  • 地理基础:描述文本中地理特征和上下文信息的结合有限
  • 空间分辨率:中等分辨率(约 30 米/像素)限制了非常小规模变化的检测
  • 时间覆盖范围:图像对之间的固定 1 年间隔
  • 大气影响:部分样本受到部分云遮挡的影响
  • 边缘边界:森林砍伐斑块边缘的模糊边界使精确分割复杂化

引用

如果使用此数据集,请引用: bibtex @article{brock2024forestchat, title={Forest-Chat: Adapting Vision-Language Agents for Interactive Forest Change Analysis}, author={Brock, James and Zhang, Ce and Anantrasirichai, Nantheera}, journal={Ecological Informatics}, year={2024} }

@article{hewarathna2024change, title={Change detection for forest ecosystems using remote sensing images with siamese attention u-net}, author={Hewarathna, AI and Hamlin, L and Charles, J and Vigneshwaran, P and George, R and Thuseethan, S and Wimalasooriya, C and Shanmugam, B}, journal={Technologies}, volume={12}, number={9}, pages={160}, year={2024} }

许可证

MIT 许可证 - 仅限学术重用目的

联系方式

有关此数据集的问题或疑问,请联系:

  • James Brock: james.brock@bristol.ac.uk
  • 布里斯托大学计算机科学学院
搜集汇总
数据集介绍
main_image_url
构建方式
Forest-Change数据集的构建过程体现了遥感生态监测领域对精细化数据标注的追求。该数据集基于Google Earth Engine平台获取的双时相卫星影像,并参考了Hewarathna等人(2024)的森林生态系统变化检测研究。其标注流程采用混合两阶段策略:首先由领域专家手动撰写描述森林覆盖变化的语义标注,确保专业性与语义丰富度;随后通过规则自动生成四组补充标注,这些标注基于定量掩膜属性,如新增毁林面积百分比、斑块大小与数量以及空间分布模式,从而在保持结构一致性的同时丰富了标注的多样性。所有影像经过预处理,统一调整为256×256像素,并进行了通道归一化处理,以适配模型训练需求。
使用方法
在生态信息学与遥感分析领域,Forest-Change数据集为多任务学习提供了标准化基准。使用者可将其应用于森林变化检测、毁林分割及变化描述等任务。由于数据存在严重的类别不平衡,评估时建议采用每类交并比和平均交并比等指标,而非整体准确率;对于标注质量,则可使用BLEU、METEOR、ROUGE-L和CIDEr-D等自然语言生成指标进行衡量。数据集已划分为训练、验证和测试子集,便于模型开发与性能对比。需要注意的是,数据存在规模有限、空间分辨率中等以及部分样本受云层遮挡等局限性,这些因素可能影响模型的泛化能力与检测精度。
背景与挑战
背景概述
森林变化检测作为遥感与生态信息学交叉领域的关键课题,其核心在于通过时序遥感影像精准识别并量化森林覆盖的动态演变。Forest-Change数据集于2024年由英国布里斯托大学的研究团队创建,旨在构建首个面向联合森林变化检测与描述任务的基准数据集。该数据集聚焦热带与亚热带地区的森林砍伐前沿,通过提供双时相卫星影像、像素级变化掩码及多粒度语义描述,致力于推动视觉-语言模型在生态监测中的应用,为自动化森林变化分析与交互式系统开发奠定了数据基础。
当前挑战
该数据集所应对的领域挑战在于,传统遥感变化检测方法难以同时实现高精度分割与自然语言描述,而森林变化常呈现碎片化、边缘模糊等复杂空间模式,加剧了模型识别难度。在构建过程中,数据集面临规模有限、类别严重不平衡的制约,大多数像素属于无变化类别,导致模型训练易偏向多数类。此外,描述文本主要依赖规则生成,语言多样性与地理上下文信息融入不足,且中等空间分辨率与固定时间间隔限制了对小尺度变化及不同时间动态的捕捉能力。
常用场景
经典使用场景
在遥感影像分析领域,Forest-Change数据集为森林变化检测与描述任务提供了首个综合性基准。该数据集通过提供双时相卫星图像、像素级森林砍伐掩膜及多粒度语义描述,典型应用于训练和评估视觉-语言模型,以联合实现森林覆盖变化的自动识别与自然语言生成。研究人员利用其标注数据,能够开发端到端的多任务学习框架,精准捕捉热带和亚热带地区森林的动态演变过程,从而推动生态监测技术的智能化发展。
解决学术问题
Forest-Change数据集有效应对了遥感领域中森林变化分析的两大核心挑战:一是解决了传统方法在变化检测与语义描述之间的割裂问题,通过集成掩膜与文本标注,支持跨模态联合建模;二是缓解了类不平衡对模型性能的干扰,其标注策略强调对少数类(森林砍伐区域)的精细刻画,为评估指标如每类交并比(IoU)提供了可靠基础。该数据集的意义在于为生态信息学建立了可复现的实验基准,促进了多学科交叉研究。
实际应用
该数据集的实际应用聚焦于全球森林资源管理与保护。基于其标注数据,可构建自动化森林监测工作流,辅助政府部门或非营利组织(如全球森林观察平台)实时追踪毁林热点区域,评估森林砍伐的严重程度与空间分布。此外,生成的语义描述能够转化为可读报告,支持决策者制定针对性保护政策,提升森林生态系统管理的效率与透明度,在应对气候变化和生物多样性丧失方面具有重要实践价值。
数据集最近研究
最新研究方向
在遥感与生态信息学领域,Forest-Change数据集作为首个专注于森林变化检测与描述联合任务的基准,正推动着多模态人工智能在环境监测中的前沿探索。当前研究聚焦于提升模型在严重类别不平衡下的泛化能力,通过结合注意力机制与孪生网络架构,优化对零星、边缘扩张等复杂森林砍伐模式的像素级分割精度。同时,利用规则生成与人工标注相结合的混合描述方法,促进了视觉-语言模型在生态场景中的语义理解,支持自动化森林监测工作流的开发。该数据集的应用不仅响应了全球森林保护的热点议题,还为应对气候变化、实现可持续发展目标提供了可靠的技术支撑,具有重要的科学与社会意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作