ACYD
收藏Hugging Face2025-09-05 更新2025-09-06 收录
下载链接:
https://huggingface.co/datasets/notadib/ACYD
下载链接
链接失效反馈官方服务:
资源简介:
农业作物产量数据集(ACYD)提供了阿根廷、巴西和美国从1979年至2024年的每周行政2级区域的协变量,用于作物产量预测和基准测试。包含天气变量如温度、风速等,陆地表面变量如叶面积指数和植被指数,以及土壤变量如土壤密度、阳离子交换容量等。数据集涵盖的地理区域包括阿根廷、巴西和美国的多个行政区域,并提供了不同作物的产量数据。
Agricultural Crop Yield Dataset (ACYD) offers weekly administrative level-2 regional covariates for crop yield prediction and benchmarking, covering the period from 1979 to 2024 across Argentina, Brazil and the United States. The dataset encompasses three categories of variables: weather variables such as temperature and wind speed; land surface variables including leaf area index and vegetation indices; and soil variables such as soil density and cation exchange capacity. It covers multiple administrative regions in Argentina, Brazil and the United States, and provides yield data for diverse crop types.
创建时间:
2025-08-29
原始信息汇总
ACYD: Agricultural Crop Yield Dataset 概述
数据集简介
Agricultural Crop Yield Dataset (ACYD) 提供阿根廷、巴西和美国1979–2024年每周、admin-2级别的协变量数据,专为作物产量预测和基准测试设计。
变量信息
气象变量
- 包含变量:2米最高温度、2米最低温度、10米风速、参考蒸散量、水汽压、雪水当量、太阳辐射、降水
- 数据来源:1979-2024年AG-ERA5,每日收集并每周平均
- 处理方式:应用HYDE-3.5耕地掩膜,按耕地比例计算加权平均值
- 覆盖范围:495个部门,无缺失值
地表变量
- 包含变量:低叶面积指数(作物、草地、灌木等)、高叶面积指数(森林、木本植被)、归一化植被指数(NDVI)
- 数据来源:
- LAI:ERA5景观再分析,每周收集并平均
- NDVI:NOAA AVHRR气候数据记录(CDR),每周收集并平均
- 1982–2013年:AVHRR NDVI(版本4,源自AVHRR地表反射率)
- 2014–2024年:NOAA AVHRR NDVI气候数据记录(更新产品)
- 处理方式:应用HYDE-3.5耕地掩膜,按耕地比例计算加权平均值
- 覆盖范围:483个部门,NDVI存在缺失值(特别是1994年及之前的周数据)
土壤变量
- 包含变量:容重、阳离子交换量、粘土含量、粗碎屑含量、氮含量、有机碳密度、有机碳含量、土壤pH值、砂粒含量、粉粒含量
- 数据来源:SoilGrids/ISRIC(2020年发布的静态土壤属性)
- 处理方式:在admin-2级别聚合(未应用耕地掩膜)
- 覆盖范围:500个部门,无缺失值
地理覆盖
- 阿根廷
- 气象数据:495个部门
- 地表数据:483个部门
- 土壤数据:500个部门
- 作物产量数据:181-296个部门(因作物而异)
作物覆盖
- 阿根廷:玉米、大豆、向日葵、小麦
时间跨度
- 气象和LAI数据:1979–2024年
- 作物产量数据:1970–2025年(因作物和国家而异)
- 土壤数据:静态(2020年首次发布)
文件类型
- 原始文件:直接从源数据集提取
- 处理后的CSV文件:每个变量一个文件,聚合到admin-2单位,边界处使用加权平均
许可证信息
- 数据集预处理代码和基准测试包:MIT许可证
- 底层数据保留原始许可证:
- ERA5/AgERA5:Copernicus许可证(相当于CC BY 4.0)
- NOAA AVHRR NDVI:公共领域(美国政府作品)
- HYDE 3.5耕地数据:CC BY 4.0
- USDA NASS(美国产量):公共领域
- IBGE(巴西产量):CC BY 3.0
- MAGyP(阿根廷产量):CC BY 4.0
- FAO(如包含):CC BY-NC-SA 3.0
搜集汇总
数据集介绍

构建方式
在农业遥感与气象数据融合领域,ACYD数据集通过整合多源异构数据构建而成。其气象变量源自AG-ERA5的日值数据经周度聚合,并应用HYDE-3.5耕地掩膜进行空间加权平均;地表植被参数分别采用ERA5景观再分析数据和NOAA AVHRR气候数据记录,土壤属性则静态引用了2020年发布的SoilGrids数据。所有数据均统一至行政二级单元进行空间聚合,其中NDVI数据保留了原始缺失值以维持数据真实性。
特点
该数据集显著特征体现在其时空维度与多模态数据的有机结合。覆盖1979-2024年长达45年的周尺度观测序列,囊括阿根廷、巴西和美国三大农业主产区的行政二级单元。不仅包含温度、降水等常规气象要素,更创新性融合了蒸散量、叶面积指数等生物物理参数,且通过耕地权重掩膜技术确保数据农业相关性。土壤参数作为静态背景场提供基础地力信息,形成动态环境变量与静态土壤属性的多维特征空间。
使用方法
研究人员可借助该数据集开展作物产量预测模型的训练与验证工作。建议将周度气象与植被参数作为时序输入特征,静态土壤数据作为空间背景变量,结合相应国家的作物产量统计数据进行监督学习。需注意不同国家行政单元数量的差异以及NDVI数据在1994年前存在的缺失情况,建议采用时空插值或掩码机制处理缺失值。基准测试时可遵循原始数据许可协议,特别要注意美国政府部门数据属于公共领域,而欧盟Copernicus数据需遵循CC-BY4.0许可要求。
背景与挑战
背景概述
农业作物产量数据集(ACYD)由国际农业研究机构于2024年创建,旨在应对全球粮食安全预测的复杂性。该数据集整合了阿根廷、巴西和美国1979-2024年的多源遥感与气象数据,以行政二级单元为空间尺度,涵盖温度、降水、叶面积指数等关键农业指标。其创新性在于采用HYDE-3.5耕地掩膜技术实现数据融合,为作物产量建模提供了时空连续的标准基准,显著推动了农业气象学与精准农业的交叉研究。
当前挑战
在领域问题层面,ACYD需解决多国作物产量预测中气候变异与植被响应的非线性耦合难题,特别是不同作物物候期对极端天气的差异化响应模式。数据构建过程中面临三大挑战:原始数据时空分辨率不一致需进行标准化聚合,NOAA AVHRR NDVI数据在1994年前存在周尺度缺失值,以及多源土壤属性数据因未应用耕地掩膜导致与作物实际生长环境存在表征偏差。
常用场景
经典使用场景
在农业气象学与遥感科学交叉领域,ACYD数据集为作物产量预测模型提供了多源异构时空数据支撑。其经典应用场景体现在整合每周尺度的气象要素、植被指数与土壤参数,通过机器学习方法构建跨年度的产量预测框架,特别适用于玉米、大豆等主要农作物的生长季动态监测与产量形成机制分析。
衍生相关工作
基于ACYD衍生的经典研究包括融合卷积神经网络的时空产量预测框架、基于注意力机制的极端天气影响量化模型,以及结合因果推断的农业政策评估方法。这些工作显著推动了农业人工智能领域的发展,其中多项成果已成为国际农业遥感顶级会议的基准参照系。
数据集最近研究
最新研究方向
农业遥感与气象数据融合领域正迎来以多源时空数据驱动作物产量预测为核心的研究浪潮。ACYD数据集凭借其跨1979-2024年的高分辨率气象、植被指数及土壤参数,为结合深度学习与物理模型的杂交算法提供了理想基准。当前研究聚焦于利用时序神经网络处理卫星遥感数据(如NDVI和LAI)与气象因子的非线性关系,尤其关注极端气候事件对南美大豆与北美玉米产量的滞后效应。该数据集推动了农业碳核算和粮食安全早期预警系统的精细化发展,成为应对全球气候变化下农业生产韧性研究的关键基础设施。
以上内容由遇见数据集搜集并总结生成



