five

H2Crop

收藏
github2025-06-13 更新2025-06-14 收录
下载链接:
https://github.com/flyakon/H2Crop
下载链接
链接失效反馈
官方服务:
资源简介:
我们通过整合30米分辨率的EnMAP高光谱数据与Sentinel-2时间序列,构建了一个分层高光谱作物数据集(H2Crop)。该数据集包含超过一百万个标注的农田地块,按照四级作物分类法组织,为精细农业作物分类和高光谱图像处理建立了重要基准。

We constructed a hierarchical hyperspectral crop dataset (H2Crop) by integrating 30-meter resolution EnMAP hyperspectral data and Sentinel-2 time series. This dataset contains over one million annotated agricultural field parcels, organized under a four-level crop classification taxonomy, and serves as a critical benchmark for precision agricultural crop classification and hyperspectral image processing.
创建时间:
2025-06-06
原始信息汇总

H²Crop数据集概述

数据集简介

H²Crop是一个用于层次化作物分类的大规模基准数据集,通过整合30米分辨率的EnMAP高光谱数据和10米分辨率的Sentinel-2时间序列数据构建而成。该数据集专注于法国农业区域,覆盖2022-2023生长季节。

关键特征

  • 数据规模:包含1,023,489个标注地块
  • 图像数量:16,344幅图像(EnMAP高光谱数据和Sentinel-2多光谱数据)
  • 层次结构:四层分类体系(6 → 36 → 82 → 101类)
  • 数据对齐:像素级对齐的高光谱-时序数据,无云采集
  • 辅助数据:提供对应地块的shapefile文件用于边界分析

数据集结构

H2Crop/ │ ├── data_lists/ # 样本划分定义 │ ├── train.txt # 12,016个训练样本 │ ├── val.txt # 2,112个验证样本
│ └── test.txt # 2,216个测试样本 │ ├── h5_data/ # HDF5格式数据 │ ├── sample_001.h5 # 样本数据文件 │ ├── sample_002.h5 │ └── ...

数据格式

每个HDF5文件包含以下标准化组:

组名 形状 数据类型 描述
/EnMAP (218, 64, 64) int16 EnMAP高光谱立方体(400-2500nm)
/S2 (12, 10, 192, 192) int16 月度Sentinel-2合成数据
/label (4, 192, 192) uint8 层次化标签(L1-L4)
/prior (4, 192, 192) uint8 上一年作物类型(L1-L4)

获取方式

数据集可从以下地址下载:H2Crop数据集下载

引用信息

如需在研究中引用本数据集,请使用以下BibTeX条目:

@misc{li2025finegrainedhierarchicalcroptype, title={Fine-grained Hierarchical Crop Type Classification from Integrated Hyperspectral EnMAP Data and Multispectral Sentinel-2 Time Series: A Large-scale Dataset and Dual-stream Transformer Method}, author={Wenyuan Li and Shunlin Liang and Yuxiang Zhang and Liqin Liu and Keyan Chen and Yongzhe Chen and Han Ma and Jianglei Xu and Yichuan Ma and Shikang Guan and Zhenwei Shi}, year={2025}, eprint={2506.06155}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2506.06155}, }

许可协议

本项目采用Apache 2.0许可证

搜集汇总
数据集介绍
main_image_url
构建方式
H2Crop数据集通过整合30米分辨率的EnMAP高光谱数据与Sentinel-2时间序列多光谱数据构建而成。该数据集覆盖法国农业区域2022-2023年生长季,包含1,023,489个标注地块,形成了四层作物分类体系。数据采集过程中,通过像素级对齐技术确保高光谱与时序数据的空间一致性,并采用云掩模处理保证数据质量。每个样本以HDF5格式存储,包含218波段的EnMAP高光谱立方体、12个月的Sentinel-2合成数据以及四层分级标签。
特点
作为当前农业遥感领域规模最大的分级作物分类基准,H2Crop数据集具有显著的多模态特性。其独特价值体现在高光谱数据(400-2500nm)与多光谱时间序列的协同融合,能够同时捕捉作物的精细光谱特征和生长动态。数据集采用层次化标注体系,涵盖6个大类至101个细粒度作物品种,支持从宏观农业结构分析到微观作物识别的全尺度研究。所有样本均附带前季作物先验信息,为变化检测研究提供时序上下文。
使用方法
该数据集以标准化HDF5格式组织,可直接接入主流深度学习框架。使用前需下载约16TB的原始数据,并通过提供的train/val/test划分文件构建数据加载器。配套代码库提供基于PyTorch的双流Transformer模型实现,支持单卡或多卡分布式训练。用户可通过修改配置文件灵活选择分类层级、数据模态(高光谱/Sentinel-2/先验信息)和时间窗口,实验脚本自动处理数据预处理、模型训练与指标评估全流程。为保障复现性,建议在配置CUDA 12.1的Linux环境下运行。
背景与挑战
背景概述
H2Crop数据集由香港大学等机构的研究团队于2025年构建,旨在解决精细农业监测中的作物分类难题。该数据集创新性地整合了30米分辨率的EnMAP高光谱数据与Sentinel-2多光谱时间序列,覆盖法国农业区超过100万块标注田块,构建了包含101种作物的四级分类体系。作为首个融合高光谱与时间序列特征的大规模农业数据集,H2Crop为精准农业、遥感解译和深度学习领域提供了重要基准,其提出的双流Transformer架构显著提升了作物分类精度,相关成果发表于计算机视觉顶级会议。
当前挑战
在领域问题层面,H2Crop需解决高光谱数据维度灾难与时间序列动态变化的耦合难题,同时应对四级分类体系带来的层级语义冲突。构建过程中,研究团队面临多源数据时空对齐的工程挑战,包括EnMAP与Sentinel-2数据的像素级配准、云层干扰消除等问题。此外,标注工作需协调农业专家知识体系与实地调查数据,确保四级分类标签的准确性与一致性,这对大规模农田样本的标注质量控制提出了极高要求。
常用场景
经典使用场景
在精准农业领域,H2Crop数据集通过整合高光谱EnMAP数据与多光谱Sentinel-2时间序列,为细粒度农作物分类提供了重要基准。其四层作物分类体系覆盖超过百万标注田块,支持从宏观作物大类到微观品种的层级识别,尤其适用于研究不同光谱特征与作物生长时序模式的关联性。数据集设计的双模态对齐特性,使得研究者能够探索高光谱空间分辨率与多光谱时间分辨率的互补优势。
解决学术问题
该数据集有效解决了农业遥感中跨模态数据融合的学术难题,通过提供像素级对齐的高光谱-时序数据,填补了现有作物分类数据在光谱维度和时间维度上的空白。实验证明引入高光谱数据可使分类F1分数提升4.2%,为验证高光谱信息在作物物候期识别、胁迫监测等方面的增益效应提供了量化依据。其层级标签体系进一步推动了细粒度分类任务中特征共享与知识迁移机制的研究。
衍生相关工作
该数据集催生了多模态Transformer在农业遥感中的创新应用,其基准方法提出的双流架构已被扩展至病虫害早期预警系统。后续研究基于该数据集的层级特性,开发了渐进式特征蒸馏网络提升小样本作物识别精度。部分工作借鉴其时空融合范式,在灌溉需求预测和碳汇估算等衍生领域取得了突破性进展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作