H2Crop
收藏arXiv2025-06-06 更新2025-06-10 收录
下载链接:
https://github.com/flyakon/H2Crop, www.glass.hku.hk
下载链接
链接失效反馈官方服务:
资源简介:
H2Crop数据集是一个集成了30米分辨率的EnMAP高光谱数据和Sentinel-2时间序列数据的大型农作物数据集,包含超过一百万个标注的字段,按照四层作物分类系统组织。该数据集旨在为精细农业作物分类和高光谱图像处理提供一个重要的基准。数据集整合了来自EnMAP的16,344张30米分辨率、218个光谱带的图像,以及Sentinel-2的12个月时间序列,涵盖了从2022年到2023年的法国农业生长季节。数据集的创建过程涉及将高光谱数据与多光谱时间序列数据相结合,以克服现有数据集在捕捉农作物细微生化变化方面的局限性。该数据集适用于解决精细农业和粮食安全监测中的作物分类问题。
The H2Crop dataset is a large-scale crop dataset that integrates 30-meter resolution EnMAP hyperspectral data and Sentinel-2 time series data. It contains over one million annotated field parcels and is organized under a four-layer crop classification system. This dataset aims to serve as a critical benchmark for precision agricultural crop classification and hyperspectral image processing. The dataset integrates 16,344 images with 30-meter resolution and 218 spectral bands sourced from EnMAP, as well as 12-month time series data from Sentinel-2, covering the French agricultural growing seasons from 2022 to 2023. The development of the H2Crop dataset involves combining hyperspectral and multispectral time series data to overcome the limitations of existing datasets in capturing subtle biochemical changes of crops. This dataset can be applied to solve crop classification problems in precision agriculture and food security monitoring.
提供机构:
香港大学地理系、北京航空航天大学宇航学院
创建时间:
2025-06-06
搜集汇总
数据集介绍

构建方式
H2Crop数据集通过整合30米分辨率的EnMAP高光谱数据和Sentinel-2时间序列数据构建而成,涵盖了法国2022-2023年的农作物生长季节。数据集构建过程包括四个关键步骤:数据预处理、标签检查、数据集划分和数据集验证。数据预处理阶段生成Sentinel-2月度无云合成数据,严格筛选EnMAP高光谱数据的无云观测,并利用EuroCrops的HCAT-v3分类系统将LPIS数据转化为四级层次标签。所有数据统一投影到同一坐标系,并裁剪为192×192像素(10米分辨率)和64×64像素(30米分辨率)的样本。标签检查阶段通过移除类别不足的样本并重新分配标签ID来解决类别不平衡问题。数据集划分采用频率感知分区方法,确保训练集(60%)、验证集(20%)和测试集(20%)中各类别均衡分布。最后,数据集验证阶段确保各子集在空间上独立,避免数据泄露。
特点
H2Crop数据集是首个将高光谱数据与多时相卫星数据相结合的大规模农作物分类数据集,具有四大核心特点:1)包含16,344幅30米分辨率的EnMAP高光谱图像(218个光谱波段),捕捉了农作物生长高峰期的生化特征;2)匹配的Sentinel-2月度时间序列数据(10米分辨率,12个月序列),用于分析物候模式;3)四级层次标签系统(6/36/82/101类),支持从粗到细的多粒度分类;4)提供历史作物类型作为先验知识。该数据集覆盖超过121万标注农田地块,在光谱特性、空间覆盖、时间信息和标签粒度方面均超越现有数据集,为精细农业分类研究提供了前所未有的多模态基准。
使用方法
H2Crop数据集支持通过双流Transformer架构进行多模态协同处理。高光谱分支采用光谱-空间解耦Vision Transformer,分别提取光谱特征和空间模式;多光谱时序分支适配Video Swin Transformer模型,从Sentinel-2月度合成数据中联合提取时空特征。通过像素洗牌上采样和卷积融合解决30米至10米的分辨率差异,保持光谱-时序特征完整性。四级层次分类头将融合特征与历史作物类型嵌入相结合,通过级联预测层实现同步多粒度分类。用户可按需选择数据模态组合(如单独使用Sentinel-2时序、加入高光谱数据或结合先验知识),并利用分层评估指标(精度/召回率/F1分数)分析不同分类层次的性能。数据集特别适用于验证高光谱数据在早期生长季节和作物变更场景中的补充价值,以及探索层次分类算法的农业知识编码机制。
背景与挑战
背景概述
H2Crop数据集由香港大学地理系Jockey Club STEM Lab of Quantitative Remote Sensing团队于2025年提出,旨在解决精细农业分类中高光谱与多光谱时序数据融合的关键科学问题。该数据集整合了30米分辨率的EnMAP高光谱数据和10米分辨率的Sentinel-2时间序列,包含超过百万个标注农田样本,构建了四级作物分类体系(6/36/82/101类),首次实现了大尺度高光谱农业遥感与多时相观测的协同基准。其创新性体现在:突破传统多光谱数据的光谱分辨率限制,通过纳米级光谱特征捕捉作物生化特性差异;建立时空对齐的层次化标注体系,推动农作物精细分类从单一时序分析向光谱-时相多维特征融合范式转变。该数据集为精准农业监测、粮食安全评估等领域提供了前所未有的多模态研究平台。
当前挑战
H2Crop数据集面临双重挑战:在领域问题层面,需解决形态相似作物(如不同小麦品种)的光谱混淆问题,以及作物物候周期重叠导致的时序特征歧义,这对传统多光谱分类方法构成显著瓶颈。在构建过程中,团队需克服高光谱数据获取成本高、覆盖不连续的技术障碍,通过严格的大气校正与云掩膜处理确保数据质量;同时应对四级分类体系下样本分布极度不均衡(部分稀有作物样本量不足100个)带来的标注难题,采用基于EuroCrops HCAT-v3知识图谱的层次化标注策略实现类别语义对齐。此外,Sentinel-2与EnMAP数据的空间分辨率差异(10m vs 30m)要求开发创新的像素级对齐与特征融合方法,以保持多模态数据的地理一致性。
常用场景
经典使用场景
H2Crop数据集在精细农业分类领域具有广泛的应用价值,特别是在多模态遥感数据融合方面表现突出。该数据集通过整合30米分辨率的EnMAP高光谱数据和Sentinel-2时间序列,为农作物分类研究提供了丰富的光谱和时序信息。其四层分类体系(6类、36类、82类和101类)支持从粗粒度到细粒度的多层次农作物识别,为精准农业监测和粮食安全评估提供了重要数据支撑。
衍生相关工作
基于H2Crop数据集,研究者提出了双流Transformer架构等创新方法。该架构通过光谱-空间Transformer处理高光谱数据,同时采用时序Swin Transformer分析Sentinel-2时间序列,实现了多模态特征的有效融合。相关研究还验证了高光谱数据在不同时间窗口和作物变化场景中的稳定增益,推动了多源遥感数据在农业监测中的深度应用。
数据集最近研究
最新研究方向
近年来,H2Crop数据集在农业遥感领域的研究方向主要集中在多模态数据融合和精细作物分类上。该数据集通过整合高光谱EnMAP数据和多时相Sentinel-2时间序列,为作物分类提供了前所未有的光谱和时间分辨率。前沿研究探索了双流Transformer架构,通过光谱-空间Transformer和时间Swin Transformer分别提取高光谱数据的精细特征和多时相数据的作物生长模式,实现了多层次作物分类。热点事件包括利用该数据集验证高光谱数据在作物分类中的补充价值,特别是在区分形态相似作物方面的优势。这一研究对精准农业和粮食安全监测具有重要意义,为全球农业监测系统提供了新的技术支持和数据基准。
相关研究论文
- 1A Novel Large-scale Crop Dataset and Dual-stream Transformer Method for Fine-grained Hierarchical Crop Classification from Integrated Hyperspectral EnMAP Data and Multispectral Sentinel-2 Time Series香港大学地理系、北京航空航天大学宇航学院 · 2025年
以上内容由遇见数据集搜集并总结生成



