five

BreizhCrops

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/tum-lmf/breizhcrops
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大规模的时间序列基准数据集,用于在法国布列塔尼地区,通过卫星数据对田间作物进行有监督的分类。该数据集涵盖了2017年的作物生长季节。数据集被划分为四个NUTS-3区域,并且其类别不平衡的特点反映了现实世界中作物类型映射数据集的情况。该数据集包含超过60万个样本,分为9个类别,每个样本包含45个时间步长和13个光谱波段。其任务是进行土地覆盖和作物分类。

This dataset is a large-scale time-series benchmark dataset for supervised classification of field crops using satellite data in Brittany, France. It covers the 2017 crop growing season. The dataset is divided into four NUTS-3 regions, and its class imbalance reflects the characteristics of real-world crop type mapping datasets. It contains over 600,000 samples categorized into 9 classes, with each sample consisting of 45 time steps and 13 spectral bands. The task of this dataset is land cover and crop classification.
提供机构:
France National Institute of Forest and Geography Information (IGN)
搜集汇总
数据集介绍
main_image_url
构建方式
在农业遥感领域,精准的作物类型识别依赖于高质量的时间序列数据。BreizhCrops数据集的构建整合了法国布列塔尼地区的实地标签与Sentinel-2卫星影像,通过聚合2017年全年的顶层大气与底层大气反射率时间序列,形成了超过60万个多元时间序列样本。每个样本对应一个农田地块,其反射率值在几何边界内进行平均计算,以捕捉作物生长的时序特征。数据按照欧洲NUTS-3行政区划进行分区,划分为训练、验证与测试子集,确保了空间独立性,为模型评估提供了可靠基础。
特点
该数据集的核心特点在于其多元时间序列的丰富性与现实代表性。它包含九种主要作物类别,如大麦、小麦、油菜籽等,同时保留了向日葵与坚果等少数类别,以反映真实农业环境中的类别不平衡问题。数据提供两个处理级别:顶层大气反射率与经过大气校正的底层大气反射率,分别包含13个与10个光谱波段,涵盖了不同的大气条件与云层干扰。时间序列长度可变,且包含云噪声,这模拟了实际遥感监测中的挑战,为算法鲁棒性测试提供了理想场景。
使用方法
BreizhCrops数据集旨在推动作物类型制图算法的标准化比较。用户可通过关联的GitHub仓库获取数据、模型实现与预训练权重,并利用提供的Python包进行快速实验。数据集已分区为训练、验证与测试集,支持直接加载与模型训练。研究人员可基于此基准测试各类时间序列分类模型,包括随机森林、卷积神经网络、循环神经网络与注意力机制模型。通过跨区域评估与超参数调优,该数据集有助于深入探究模型在噪声处理、类别不平衡与时空泛化等方面的性能。
背景与挑战
背景概述
在遥感科学与农业信息学交叉领域,作物类型精准制图对于粮食安全监测与农业政策制定具有关键意义。BreizhCrops数据集由德国慕尼黑工业大学与法国布列塔尼大学的研究团队于2019年联合构建,旨在为卫星时序影像的作物分类研究提供标准化基准。该数据集聚焦法国布列塔尼地区,整合了2017年Sentinel-2卫星的大气顶层与底层反射率时序数据及农田地块标签,涵盖大麦、小麦、油菜等九类主要作物,样本量逾60万条。其创新性在于首次系统化融合多层级遥感数据与地理统计单元分区,为深度学习模型在时序分类任务中的性能比较提供了可靠平台,推动了遥感时序分析方法在精准农业中的可复现性与跨区域适用性研究。
当前挑战
BreizhCrops数据集所针对的作物类型制图任务面临多重挑战:其一,农业景观中普遍存在的类别不平衡问题,主导作物(如玉米、草甸)与稀有作物(如向日葵、坚果)样本量差异达数量级,影响模型对少数类的识别鲁棒性;其二,光学卫星时序数据固有的云层噪声干扰,导致反射率序列中出现异常峰值,传统方法依赖预处理掩膜与插值,但如何端到端建模噪声环境下的时序特征仍需探索。在数据构建层面,Sentinel-2影像因轨道重叠导致不同区域时序长度不均,需设计自适应序列处理方法;同时,土壤质地、气候等环境因素的空间异质性引发类别分布的区域偏移,要求模型具备跨地理单元的泛化能力。此外,地块间空间自相关现象可能造成评估偏差,需通过地理分区策略削弱数据泄漏风险。
常用场景
经典使用场景
在遥感与农业信息学领域,BreizhCrops数据集作为卫星图像时间序列分类的基准工具,其经典应用场景聚焦于作物类型制图研究。该数据集整合了法国布列塔尼地区Sentinel-2卫星的多时相遥感影像与实地作物标签,为深度学习模型提供了大规模、多光谱的时间序列样本。研究者利用这些数据训练和验证卷积神经网络、循环神经网络及注意力机制等先进算法,以捕捉作物生长周期中的时序变化特征,实现高精度的自动作物分类。
实际应用
在实际应用层面,BreizhCrops数据集为精准农业与土地资源管理提供了重要支撑。基于该数据集训练的模型可用于大规模作物监测,帮助农业部门实时掌握作物种植结构,优化补贴政策与资源配置。同时,这些技术能够辅助环境监测机构评估土地利用变化,支持可持续农业实践。数据集的开放性与易用性也降低了技术门槛,使得从业者能够快速部署作物分类系统,提升农业遥感应用的效率与普及度。
衍生相关工作
围绕BreizhCrops数据集,学术界衍生了一系列经典研究工作。例如,Temporal Convolutional Neural Network(TempCNN)被专门设计用于处理卫星时间序列分类任务,并在该数据集上验证了其有效性。同时,研究者将Transformer等注意力机制模型引入遥感领域,探索其在捕获长时序依赖关系方面的优势。这些工作不仅推动了深度学习在遥感中的应用,还促进了如InceptionTime、StarRNN等通用时间序列分类模型的适配与优化,形成了丰富的算法比较与创新生态。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作