five

EUROCROPSML

收藏
arXiv2024-07-25 更新2024-07-26 收录
下载链接:
https://zenodo.org/records/12168505
下载链接
链接失效反馈
官方服务:
资源简介:
EUROCROPSML数据集由慕尼黑工业大学遥感技术系开发,旨在为欧洲农业地块的作物类型分类提供一个分析就绪的遥感机器学习基准数据集。该数据集包含706683条数据,覆盖176个作物类别,利用Sentinel-2 L1C数据的年时间序列和空间坐标进行标记。数据集的创建过程包括数据采集和预处理,最终形成可用于基准测试的训练和评估数据集分割。该数据集主要应用于作物类型分类的机器学习算法开发,特别是在少样本学习场景中,以解决跨不同气候和作物类型的分类问题。

The EUROCROPSML dataset was developed by the Department of Remote Sensing Technology, Technical University of Munich, aiming to provide an analysis-ready remote sensing machine learning benchmark dataset for crop type classification of agricultural plots across Europe. It contains 706,683 data samples, covering 176 crop categories, and is labeled using annual time series of Sentinel-2 L1C data and spatial coordinates. The dataset creation process includes data collection and preprocessing, ultimately forming train and evaluation dataset splits suitable for benchmark testing. This dataset is mainly applied to the development of machine learning algorithms for crop type classification, especially in few-shot learning scenarios, to address classification problems across different climates and crop types.
提供机构:
慕尼黑工业大学遥感技术系
创建时间:
2024-07-25
搜集汇总
数据集介绍
main_image_url
构建方式
EUROCROPSML数据集的构建是通过整合Sentinel-2卫星图像和EUROCROPS参考数据中的作物类型标签来完成的。首先,收集了与EUROCROPS参考数据中地块重叠的Sentinel-2 L1C级数据,然后对每个地块的卫星图像进行裁剪,并计算每个时间点每个波段的中值像素值,形成时间序列数据集。
特点
该数据集的特点包括:覆盖了不同气候区的多个地理区域,提供了706683个数据点的176个作物类别的自我声明多类别标签,具有统一的作物分类体系,提供了细致的年度时间序列数据,以及为基准测试机器学习算法而预先构建的训练和评估数据集划分。
使用方法
使用EUROCROPSML数据集时,可以利用提供的开源Python包eurocropsml进行方便地访问和数据加载。用户可以通过命令行界面与数据集交互,创建自己的基准任务,并在PyTorch框架内进行机器学习模型的训练和评估。
背景与挑战
背景概述
EUROCROPSML数据集是由Technical University of Munich的Chair of Remote Sensing Technology和dida Datenschmiede GmbH共同创建的。该数据集于2021年发布,旨在为少样本作物类型分类研究提供分析就绪的遥感机器学习数据集。它包含706683个多类标记数据点,涵盖176个作物类别,特征年度时间序列的Sentinel-2 L1C数据。该数据集基于开源的EUROCROPS集合,并公开可用在Zenodo上。EUROCROPSML的创建旨在解决现有数据集在单一国家范围内限制、类别数量有限或农业地块数量有限的问题,为算法评估和比较提供更多样化的地理区域、更准确的作物标签和更丰富的时序数据。
当前挑战
EUROCROPSML数据集在构建过程中遇到的挑战包括:1)如何整合来自不同国家的多样化和异构遥感数据;2)如何处理和清洗大量原始卫星数据以获得高质量的时间序列数据;3)如何为不同国家和作物类型提供准确的标签信息;4)如何设计有效的数据划分策略以支持迁移学习和少样本学习。在解决的领域问题方面,该数据集面临的挑战包括:如何利用有限的数据样本进行有效的作物类型分类,以及如何在不同气候和作物类型之间进行知识迁移。
常用场景
经典使用场景
EUROCROPSML数据集的经典使用场景在于农业领域的遥感监测,尤其是作物类型的分类研究。该数据集提供了丰富的多时相Sentinel-2卫星图像时间序列,以及详细的作物类型标签,使得研究人员能够利用机器学习技术,进行作物类型的识别和分类,从而提高农业监测的准确性和效率。
解决学术问题
该数据集解决了现有作物分类数据集覆盖范围有限、类别数量较少、样本量不足等问题,为作物类型分类研究提供了更为全面和细致的数据基础。通过提供跨国家的 harmonized crop labels,它还促进了不同地区之间的知识转移和算法性能的比较。
衍生相关工作
基于EUROCROPSML数据集,已经衍生出了一系列相关的工作,包括对数据集的分析和算法研究。这些工作不仅涉及作物分类,还扩展到了时间序列分析、知识迁移学习等多个领域,进一步推动了遥感数据处理和机器学习在农业领域的应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作