five

时间序列农作物分类基准数据集(EuroCropsML)

收藏
国家对地观测科学数据中心2024-10-30 更新2026-01-30 收录
下载链接:
https://noda.ac.cn/datasharing/datasetDetails/671afa087c8b413f1c2051f0
下载链接
链接失效反馈
官方服务:
资源简介:
EuroCropsML* 是一个现成的机器学习数据集,结合了 EuroCrops 参考数据与 2021 年的 Sentinel-2 反射率数据。该数据集包含来自拉脱维亚、葡萄牙和爱沙尼亚的数据,旨在用于少样本农作物种类分类的基准测试。我们使用 Eurostat 的 GISCO 数据集将 EuroCrops 地块映射到其所属的 NUTS1-3 区域。 提供的数据分为两个阶段: raw_data.zip(阶段 1):每个国家对应一个数据框,包含每个地块的年度观测时间序列,以及地块几何形状和类别的单独文件(EC_hcat_c 表示农作物分类的 10 位 HCAT 代码,指示农作物的层次结构)。 preprocess.zip(阶段 2):经过处理的 .npz 文件。每个数据点及其元数据都保存在一个 .npz 文件中。此外,我们还进行了云层移除处理。每个 .npz 文件的命名格式为:<NUTS3region>_<parcelID>_<EC_hcat_c>.npz。 此外,split.zip 包含 .json 文件,这些文件将 preprocess.zip 中的数据划分为预训练/元学习(训练和验证)集和微调集(训练、验证和测试)。我们提供了两个使用场景: • latvia_portugal_vs_estonia:在拉脱维亚和葡萄牙进行预训练(142 个不同类别),在爱沙尼亚进行微调(127 个不同类别,其中 34 个类别在预训练中未曾见过)。 • latvia_vs_estonia:在拉脱维亚进行预训练(103 个不同类别),在爱沙尼亚进行微调(127 个不同类别,其中 46 个类别在预训练中未曾见过)。 对于这两种使用场景,微调数据集的划分如下: • 训练集:1 样本、5 样本、10 样本、20 样本、100 样本、200 样本、500 样本(用于少样本分类和基准测试),以及所有样本。 • 验证集:1000 个样本。 • 测试集:所有样本。
创建时间:
2024-10-30
二维码
社区交流群
二维码
科研交流群
商业服务