时间序列农作物分类基准数据集(EuroCropsML)
收藏国家对地观测科学数据中心2024-10-30 更新2026-01-30 收录
下载链接:
https://noda.ac.cn/datasharing/datasetDetails/671afa087c8b413f1c2051f0
下载链接
链接失效反馈官方服务:
资源简介:
EuroCropsML* 是一个现成的机器学习数据集,结合了 EuroCrops 参考数据与 2021 年的 Sentinel-2 反射率数据。该数据集包含来自拉脱维亚、葡萄牙和爱沙尼亚的数据,旨在用于少样本农作物种类分类的基准测试。我们使用 Eurostat 的 GISCO 数据集将 EuroCrops 地块映射到其所属的 NUTS1-3 区域。
提供的数据分为两个阶段:
raw_data.zip(阶段 1):每个国家对应一个数据框,包含每个地块的年度观测时间序列,以及地块几何形状和类别的单独文件(EC_hcat_c 表示农作物分类的 10 位 HCAT 代码,指示农作物的层次结构)。
preprocess.zip(阶段 2):经过处理的 .npz 文件。每个数据点及其元数据都保存在一个 .npz 文件中。此外,我们还进行了云层移除处理。每个 .npz 文件的命名格式为:<NUTS3region>_<parcelID>_<EC_hcat_c>.npz。
此外,split.zip 包含 .json 文件,这些文件将 preprocess.zip 中的数据划分为预训练/元学习(训练和验证)集和微调集(训练、验证和测试)。我们提供了两个使用场景:
• latvia_portugal_vs_estonia:在拉脱维亚和葡萄牙进行预训练(142 个不同类别),在爱沙尼亚进行微调(127 个不同类别,其中 34 个类别在预训练中未曾见过)。
• latvia_vs_estonia:在拉脱维亚进行预训练(103 个不同类别),在爱沙尼亚进行微调(127 个不同类别,其中 46 个类别在预训练中未曾见过)。
对于这两种使用场景,微调数据集的划分如下:
• 训练集:1 样本、5 样本、10 样本、20 样本、100 样本、200 样本、500 样本(用于少样本分类和基准测试),以及所有样本。
• 验证集:1000 个样本。
• 测试集:所有样本。
创建时间:
2024-10-30



