five

Hierarchical Hyperspectral Crop dataset (H2Crop)

收藏
arXiv2025-06-09 更新2025-06-11 收录
下载链接:
https://github.com/flyakon/H2Crop
下载链接
链接失效反馈
官方服务:
资源简介:
H2Crop数据集是一个集成30米分辨率的EnMAP高光谱数据和Sentinel-2时间序列数据的大型数据集,用于精细农业作物分类。该数据集包含超过一百万个标注的地块,按四级作物分类体系组织。H2Crop数据集为精细农业作物分类和超光谱图像处理提供了一个重要的基准。该数据集结合了高光谱图像的纳米级光谱分辨率和Sentinel-2时间序列的多时相数据,能够捕捉到作物细微的光谱变化和生长动态。

The H2Crop dataset is a large-scale resource integrating 30-meter resolution EnMAP hyperspectral data and Sentinel-2 time-series data, tailored for precision agricultural crop classification. It contains over one million annotated parcels, organized under a four-level crop classification taxonomy. The H2Crop dataset serves as a critical benchmark for precision agricultural crop classification and hyperspectral image processing. By combining the nanometer-scale spectral resolution of hyperspectral imagery and the multi-temporal data from Sentinel-2 time series, this dataset can capture subtle spectral variations and growth dynamics of crops.
提供机构:
香港大学地球科学系、北京航空航天大学宇航学院
创建时间:
2025-06-06
原始信息汇总

H²Crop数据集概述

数据集简介

H²Crop是一个用于层次化作物分类的大规模基准数据集,通过整合30米分辨率的EnMAP高光谱数据和10米分辨率的Sentinel-2时间序列数据构建而成。该数据集为细粒度农业作物分类和高光谱图像处理提供了重要基准。

关键特性

  • 数据规模:包含1,023,489个标注地块,覆盖2022-2023年生长季节
  • 数据模态
    • 30米分辨率的EnMAP高光谱数据
    • 10米分辨率的Sentinel-2多光谱时间序列数据
  • 层次结构:四层作物分类体系(6 → 36 → 82 → 101类)
  • 数据质量:像素对齐的高光谱-时序数据,无云采集
  • 辅助数据:包含对应地块的shapefile文件,用于进一步分析

数据集结构

数据集按以下方式组织:

H2Crop/ │ ├── data_lists/ # 样本划分定义 │ ├── train.txt # 12,016个训练样本 │ ├── val.txt # 2,112个验证样本
│ └── test.txt # 2,216个测试样本 │ ├── h5_data/ # HDF5格式数据 │ ├── sample_001.h5 # 样本数据文件 │ ├── sample_002.h5 │ └── ...

数据格式

每个HDF5文件包含以下标准化组:

组名 形状 数据类型 描述
/EnMAP (218, 64, 64) int16 EnMAP高光谱立方体(400-2500nm)
/S2 (12, 10, 192, 192) int16 月度Sentinel-2合成数据
/label (4, 192, 192) uint8 层次化标签(L1-L4)
/prior (4, 192, 192) uint8 上一年作物类型(L1-L4)

获取方式

数据集可从以下地址下载: https://glass.hku.hk/casual/H2Crop/

相关论文

Fine-grained Hierarchical Crop Type Classification from Integrated Hyperspectral EnMAP Data and Multispectral Sentinel-2 Time Series: A Large-scale Dataset and Dual-stream Transformer Method

许可协议

Apache 2.0许可证

搜集汇总
数据集介绍
main_image_url
构建方式
在精准农业和粮食安全监测领域,高分辨率遥感数据的重要性日益凸显。H2Crop数据集通过整合30米分辨率的EnMAP高光谱数据和Sentinel-2时间序列,构建了一个多层次作物分类基准。数据采集过程严格筛选了法国2022-2023生长季的云量低于10%的影像,并采用EuroCrops的HCAT-v3分类体系对LPIS地块数据进行四层级标注。通过像素级配准和空间裁剪,最终形成包含16,344个样本的数据集,每个样本包含192×192像素的Sentinel-2月合成序列和64×64像素的EnMAP高光谱数据,并采用频率感知的分割策略确保训练集(60%)、验证集(20%)和测试集(20%)的类别平衡。
特点
该数据集在农业遥感领域具有三大突破性特征:其一,首次实现了高光谱数据(218个波段)与多时相中分辨率数据(12个月序列)的时空对齐,为研究光谱-物候特征协同效应提供了理想平台;其二,构建了包含6大类、36中类、82亚类和101细类的四层级分类体系,可支持从宏观农作物分布到微观品种识别的全尺度研究;其三,创新性地整合了历史种植记录作为先验知识,为作物轮作模式分析提供了时序上下文。相较于现有数据集,H2Crop在样本量(超百万标注地块)和空间覆盖(法国全境)方面均实现数量级提升。
使用方法
该数据集支持端到端的精细农业研究流程。研究者可通过双流Transformer架构并行处理高光谱数据(光谱-空间ViT分支)和时序数据(Video Swin Transformer分支),利用分层分类头同步输出多粒度预测。对于算法验证,建议采用分层F1-score作为核心指标,特别关注L3-L4细分类别的性能表现。数据预处理时需注意30m-10m分辨率差异的尺度转换问题,推荐使用像素混洗上采样保持光谱特征。进阶研究可探索历史先验知识与高光谱特征的交互机制,或利用层级标签开发课程学习策略。数据集GitHub仓库提供了标准化的数据加载接口和基线模型实现。
背景与挑战
背景概述
Hierarchical Hyperspectral Crop dataset (H2Crop) 是由香港大学和北京航空航天大学的研究团队于2025年构建的一个大规模农业遥感数据集,旨在解决精细作物分类中的关键科学问题。该数据集创新性地整合了30米分辨率的EnMAP高光谱数据和10米分辨率的Sentinel-2时间序列,包含超过100万个标注的农田地块,采用四级作物分类体系(6/36/82/101类)。作为首个融合高光谱与多时相多光谱数据的农业基准数据集,H2Crop通过捕捉作物的生化特征(高光谱)与物候动态(时间序列),显著提升了传统基于多光谱的作物分类精度,为精准农业和粮食安全监测提供了新的研究范式。其构建工作发表在计算机视觉顶会论文中,标志着遥感农业分析从空间监测向光谱-时空多维感知的重要转变。
当前挑战
H2Crop数据集面临的核心挑战体现在两个维度:科学问题层面,需解决形态相似作物(如不同小麦品种)在常规多光谱数据中难以区分的问题,这要求模型能够解析纳米级光谱特征与亚季节性物候模式的耦合关系;构建技术层面,需克服高光谱数据获取周期长(EnMAP重访周期长)、多源数据时空配准误差(30m/10m分辨率差异)、以及四级分类体系下样本分布极度不均衡(某些稀有作物仅占0.01%)等难题。此外,数据标注依赖欧盟LPIS系统,需处理各国作物分类标准差异,并通过HCATv3分类体系实现跨年度的标注一致性,这些都为数据集的质量控制带来严峻考验。
常用场景
经典使用场景
在精准农业和粮食安全监测领域,H2Crop数据集通过整合高光谱EnMAP数据与多时相Sentinel-2影像,为细粒度作物分类建立了新范式。其四层级作物分类体系(6/36/82/101类)支持从宏观作物群落到微观品种的递进识别,尤其适用于形态相似作物(如小麦亚种)的光谱-物候联合建模。典型应用包括:基于双流Transformer架构的端到端分类模型开发,其中高光谱分支捕捉叶片生化特性差异,时序分支解析生长周期动态,二者协同提升分类精度4.2-6.3个百分点。
实际应用
H2Crop的实际价值体现在农业全链条管理中:1) 种植规划阶段,通过历史作物类型嵌入预测轮作模式;2) 生长期监测中,融合5-6月高光谱关键期数据与全年Sentinel-2时序实现早期分类(仅用6个月数据F1达62.2%);3) 政策制定层面,其30m分辨率支持欧盟共同农业政策(CAP)的田块级补贴核查。在法国2022-2023年作物制图中,该数据集成功区分了101类作物中光谱差异仅0.3%的近似品种。
衍生相关工作
该数据集催生了多模态农业分析的创新方法:1) AgriFM利用H2Crop预训练首个遥感基础模型,在亚洲小麦制图中迁移准确率达89.7%;2) RSPrompter基于层级标签开发提示学习框架,将小样本作物分类精度提升18.5%;3) 后续研究扩展出变化检测任务,通过对比年度高光谱特征实现作物轮作模式量化。相关成果发表于IEEE TGRS、ISPRS等期刊,推动形成了'高光谱+时序+层级标签'的新型研究范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作