ibm-nasa-geospatial/hls_burn_scars
收藏Hugging Face2023-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ibm-nasa-geospatial/hls_burn_scars
下载链接
链接失效反馈官方服务:
资源简介:
---
size_categories:
- n<1K
license: cc-by-4.0
language:
- en
---
# Dataset Card for HLS Burn Scar Scenes
## Dataset Description
- **Homepage: https://huggingface.co/datasets/nasa-impact/hls_burn_scars**
- **Point of Contact: Dr. Christopher Phillips (cep0013@uah.edu)**
### Dataset Summary
This dataset contains Harmonized Landsat and Sentinel-2 imagery of burn scars and the associated masks for the years 2018-2021 over the contiguous United States. There are 804 512x512 scenes. Its primary purpose is for training geospatial machine learning models.
## Dataset Structure
## TIFF Metadata
Each tiff file contains a 512x512 pixel tiff file. Scenes contain six bands, and masks have one band. For satellite scenes, each band has already been converted to reflectance.
## Band Order
For scenes:
Channel, Name, HLS S30 Band number
1, Blue, B02
2, Green, B03
3, Red, B04
4, NIR, B8A
5, SW 1, B11
6, SW 2, B12
Masks are a single band with values:
1 = Burn scar
0 = Not burned
-1 = Missing data
## Class Distribution
Burn Scar - 11%
Not burned - 88%
No Data - 1%
## Data Splits
The 804 files have been randomly split into training (2/3) and validation (1/3) directories, each containing the masks, scenes, and index files.
## Dataset Creation
After co-locating the shapefile and HLS scene, the 512x512 chip was formed by taking a window with the burn scar in the center. Burn scars near the edges of HLS tiles are offset from the center.
Images were manually filtered for cloud cover and missing data to provide as clean a scene as possible, and burn scar presence was also manually verified.
## Source Data
Imagery are from V1.4 of HLS. A full description and access to HLS may be found at https://hls.gsfc.nasa.gov/
The data were from shapefiles maintained by the Monitoring Trends in Burn Severity (MTBS) group. The original data may be found at:
https://mtbs.gov/
## Citation
If this dataset helped your research, please cite `HLS Burn Scars` in your publications. Here is an example BibTeX entry:
```
@software{HLS_Foundation_2023,
author = {Phillips, Christopher and Roy, Sujit and Ankur, Kumar and Ramachandran, Rahul},
doi = {10.57967/hf/0956},
month = aug,
title = {{HLS Foundation Burnscars Dataset}},
url = {https://huggingface.co/ibm-nasa-geospatial/hls_burn_scars},
year = {2023}
}
```
样本规模分类:
- 样本量小于1000
许可证:CC BY 4.0
语言:
- 英语
# HLS烧伤疤痕场景数据集卡片
## 数据集说明
- **数据集主页**:https://huggingface.co/datasets/nasa-impact/hls_burn_scars
- **联系方式**:Christopher Phillips 博士(cep0013@uah.edu)
### 数据集概述
本数据集包含2018-2021年美国毗邻本土地区的烧伤疤痕区域的协调Landsat与Sentinel-2(Harmonized Landsat and Sentinel-2, HLS)影像及配套掩膜文件,共计804张512×512像素的影像场景。本数据集的核心用途为训练地理空间机器学习模型。
## 数据集结构
## TIFF文件元数据
每张TIFF文件均为512×512像素的影像。影像场景包含6个波段,掩膜文件则仅含1个波段。对于卫星影像场景,所有波段已转换为反射率值。
## 波段顺序
影像场景波段顺序如下:
通道序号 | 波段名称 | HLS S30 波段编号
1 | 蓝光波段(Blue) | B02
2 | 绿光波段(Green) | B03
3 | 红光波段(Red) | B04
4 | 近红外波段(NIR) | B8A
5 | 短波红外1(SW 1) | B11
6 | 短波红外2(SW 2) | B12
掩膜文件为单波段影像,各像素值含义如下:
1 = 烧伤疤痕区域
0 = 未燃烧区域
-1 = 数据缺失
## 类别分布
烧伤疤痕区域:11%
未燃烧区域:88%
无有效数据:1%
## 数据划分
804份文件已被随机划分为训练集(占比2/3)与验证集(占比1/3),两个目录下均包含影像、掩膜文件及索引文件。
## 数据集构建流程
在将形状文件与HLS影像场景匹配对齐后,以烧伤疤痕区域为中心截取512×512像素的影像块。对于位于HLS影像瓦片边缘附近的烧伤疤痕区域,其中心位置会相应偏移以适配。
研究人员已手动筛选掉存在云覆盖与数据缺失的影像,并人工验证了烧伤疤痕区域的存在性,以确保影像场景尽可能干净无干扰。
## 源数据说明
影像数据来自HLS V1.4版本。关于HLS的完整说明与获取方式,请访问:https://hls.gsfc.nasa.gov/
本次数据集所用的烧伤疤痕形状文件由监测烧伤严重度趋势(Monitoring Trends in Burn Severity, MTBS)团队维护,原始数据可通过以下链接获取:https://mtbs.gov/
## 引用说明
若本数据集对您的研究有所帮助,请在出版物中引用`HLS Burn Scars`。以下为示例BibTeX引用条目:
bibtex
@software{HLS_Foundation_2023,
author = {Phillips, Christopher and Roy, Sujit and Ankur, Kumar and Ramachandran, Rahul},
doi = {10.57967/hf/0956},
month = aug,
title = {{HLS Foundation Burnscars Dataset}},
url = {https://huggingface.co/ibm-nasa-geospatial/hls_burn_scars},
year = {2023}
}
提供机构:
ibm-nasa-geospatial
原始信息汇总
数据集概述
数据集名称
HLS Burn Scar Scenes
数据集描述
该数据集包含2018-2021年美国连续地区的Harmonized Landsat和Sentinel-2烧伤疤痕影像及其相关掩码。共有804个512x512场景,主要用于训练地理空间机器学习模型。
数据集结构
- 文件类型:TIFF
- 分辨率:512x512像素
- 场景包含:六个波段(已转换为反射率)
- 掩码包含:一个波段
波段顺序
- 场景波段:
- 1: Blue (B02)
- 2: Green (B03)
- 3: Red (B04)
- 4: NIR (B8A)
- 5: SW 1 (B11)
- 6: SW 2 (B12)
- 掩码波段:
- 1: Burn scar
- 0: Not burned
- -1: Missing data
类别分布
- Burn Scar: 11%
- Not burned: 88%
- No Data: 1%
数据分割
数据集随机分为训练集(2/3)和验证集(1/3),每个部分包含掩码、场景和索引文件。
数据来源
- 影像来源:HLS V1.4
- 烧伤疤痕数据来源:Monitoring Trends in Burn Severity (MTBS) 维护的Shapefile
引用信息
@software{HLS_Foundation_2023, author = {Phillips, Christopher and Roy, Sujit and Ankur, Kumar and Ramachandran, Rahul}, doi = {10.57967/hf/0956}, month = aug, title = {{HLS Foundation Burnscars Dataset}}, url = {https://huggingface.co/ibm-nasa-geospatial/hls_burn_scars}, year = {2023} }
搜集汇总
数据集介绍

构建方式
在遥感科学领域,精准的火灾疤痕识别对生态系统监测至关重要。该数据集通过整合Landsat与Sentinel-2卫星的协调影像,选取2018至2021年间美国本土的火灾疤痕区域构建而成。其核心方法在于将MTBS组织提供的火灾疤痕矢量数据与HLS卫星影像进行空间配准,以疤痕为中心截取512x512像素的影像块。为确保数据质量,研究团队对云层覆盖与数据缺失情况进行了人工筛选,并对疤痕存在性进行了目视验证,最终形成包含804个场景的标准化数据集。
特点
该数据集在遥感影像分析中展现出鲜明的技术特征。影像数据涵盖蓝、绿、红、近红外及两个短波红外共六个光谱波段,均已转换为反射率数值,为多光谱分析提供了坚实基础。掩膜数据采用三值编码体系,清晰区分火灾疤痕、未燃烧区域及缺失数据。数据集遵循严谨的类别分布,其中火灾疤痕占比11%,未燃烧区域88%,缺失数据仅占1%,这种分布真实反映了自然场景中火灾疤痕的空间特征。所有数据已按2:1比例随机划分为训练集与验证集,为机器学习模型开发提供了即用型架构。
使用方法
在应用层面,该数据集为地理空间机器学习模型训练提供了完整解决方案。使用者可直接加载预分割的训练与验证目录,每个目录均包含影像场景、对应掩膜及索引文件。影像数据采用TIFF格式存储,波段顺序明确标注,便于直接输入卷积神经网络进行语义分割训练。掩膜的单波段设计简化了标签处理流程,其-1、0、1的三值体系可直接转换为模型训练所需的热编码格式。研究人员可基于该数据集开发火灾疤痕自动识别算法,通过端到端训练优化模型性能,并将验证集结果作为模型泛化能力的客观评估标准。
背景与挑战
背景概述
在遥感与地球科学领域,精确监测与评估野火后的烧伤疤痕对于生态恢复、碳循环研究及灾害管理至关重要。HLS烧伤疤痕数据集由IBM与NASA合作,于2023年由Christopher Phillips博士等研究人员发布,整合了2018年至2021年美国本土的Harmonized Landsat与Sentinel-2影像数据。该数据集的核心研究问题在于通过高分辨率多光谱影像,训练地理空间机器学习模型,以自动化识别烧伤区域,从而提升野火影响评估的时效性与准确性,对全球环境监测与气候变化研究具有显著推动作用。
当前挑战
该数据集旨在解决遥感影像中烧伤疤痕自动分割与分类的挑战,其难点在于烧伤区域在光谱特征上常与裸土、阴影等地物混淆,且受云层遮挡、季节性植被变化等因素干扰,导致模型泛化能力受限。在构建过程中,研究人员面临数据获取与处理的复杂性,需手动对齐MTBS烧伤形状文件与HLS影像,并过滤云覆盖及缺失数据,同时确保烧伤疤痕位于影像中心以优化样本质量,这些步骤耗时且依赖人工验证,增加了数据集构建的难度与成本。
常用场景
经典使用场景
在遥感与地理空间分析领域,HLS Burn Scar Scenes数据集为机器学习模型训练提供了标准化资源。其经典使用场景聚焦于利用多光谱卫星影像,通过监督学习方式识别和分割火灾后的烧伤疤痕区域。研究人员通常将512x512像素的影像与对应掩码结合,构建端到端的语义分割模型,以自动化提取烧伤疤痕的空间分布特征。这种应用不仅提升了火灾影响评估的效率,还为后续生态恢复监测奠定了数据基础。
衍生相关工作
基于该数据集衍生的经典工作主要集中在深度学习架构创新与跨领域方法融合方面。研究者们开发了多种基于U-Net、Transformer的语义分割模型,显著提升了烧伤疤痕边界的识别精度。部分工作进一步将多时相分析引入模型训练,实现了烧伤疤痕动态监测。这些成果已发表于《Remote Sensing of Environment》等顶级期刊,并催生了开源工具库如GeoAI-Fire的诞生,持续推动着地理空间智能技术的进步。
数据集最近研究
最新研究方向
在遥感与灾害监测领域,HLS Burn Scar Scenes数据集正推动着前沿研究向高精度、自动化方向发展。该数据集整合了Landsat与Sentinel-2的协同观测数据,为野火燃烧痕迹的智能识别提供了标准化训练资源。当前研究热点聚焦于利用深度学习模型,如卷积神经网络与Transformer架构,实现燃烧区域的多光谱特征自动提取与动态监测,以提升灾害评估的时效性与准确性。随着全球极端气候事件频发,该数据集在野火风险评估、生态系统恢复及气候变化响应中的科学价值日益凸显,为构建智能地球观测系统提供了关键数据支撑。
以上内容由遇见数据集搜集并总结生成



