SpatioTemporalYield
收藏Hugging Face2024-12-24 更新2024-12-25 收录
下载链接:
https://huggingface.co/datasets/ellaampy/SpatioTemporalYield
下载链接
链接失效反馈官方服务:
资源简介:
SpatioTemporalYield数据集用于比较研究,涵盖了美国五个主要玉米生产州的玉米产量预测。数据集包括numpy数组和json文件,描述了从2003年到2021年的时间序列数据,每个文件代表一个特定年份和地理区域的玉米产量数据。数据结构为T(时间)x C(通道)x S(像素数),包含46个时间序列和12个通道。特征信息包括红、近红外、蓝、绿、近红外2、短波红外1、短波红外2、最低温度、最高温度、降水量、归一化植被指数和归一化水指数,这些数据来源于MOD9A1.061和Daymet。
创建时间:
2024-12-21
原始信息汇总
SpatioTemporalYield 数据集概述
数据集简介
SpatioTemporalYield 数据集用于探索县级别产量预测的时空编码策略。该数据集在比较研究中使用,旨在通过机器学习技术预测作物产量,特别是在如何编码空间和时间信息方面。
数据覆盖范围
- 数据集覆盖美国前五大玉米生产州:爱荷华州(Iowa)、伊利诺伊州(Illinois)、印第安纳州(Indiana)、内布拉斯加州(Nebraska)和明尼苏达州(Minnesota)。
- 这些州在2021年合计占美国玉米总产量的超过一半。
数据结构
- 数据集包含超过8000个numpy数组文件,格式为
YYYY_GEOID.npy,以及一个对应的标签文件labels.json。YYYY表示数据获取的年份(从2003年到2021年)。GEOID是一个五位字符代码,前两位表示州ID,后三位表示县ID。- 每个
.npy文件的结构为T (时间) x C (通道) x S (像素数)。 - 每个数组包含46个序列(从1月到12月)和12个通道。
通道/特征信息
| 序号 | 波段 | 来源 |
|---|---|---|
| 0 | red | MOD9A1.061 |
| 1 | nir | MOD9A1.061 |
| 2 | blue | MOD9A1.061 |
| 3 | green | MOD9A1.061 |
| 4 | nir2 | MOD9A1.061 |
| 5 | swir1 | MOD9A1.061 |
| 6 | swir2 | MOD9A1.061 |
| 7 | tmin | Daymet |
| 8 | tmax | Daymet |
| 9 | prcp | Daymet |
| 10 | ndvi | MOD9A1.061 (衍生) |
| 11 | ndwi | MOD9A1.061 (衍生) |
引用
如果使用该数据集,请引用相关工作(待定)。
备注
SpatioTemporalYield 是正在进行的多任务和多感官基准数据集创建工作的首个版本,用于美国农业监测。请定期检查更新。
搜集汇总
数据集介绍

构建方式
SpatioTemporalYield数据集的构建基于美国五大主要玉米生产州的时空数据,涵盖了从2003年至2021年的历史记录。数据集通过整合MOD9A1.061卫星影像和Daymet气象数据,形成了包含46个时间序列和12个通道的numpy数组,每个数组以年份和地理标识符命名。这种结构化的数据组织方式,旨在为玉米产量预测提供多维度的时空信息支持。
特点
该数据集的显著特点在于其多源数据的融合与精细的时空分辨率。通过结合卫星遥感数据和气象观测数据,数据集不仅提供了丰富的光谱信息,还包含了关键的气候变量,如温度和降水量。此外,数据集的结构设计允许用户灵活地提取特定年份和地理区域的数据,为农业监测和产量预测提供了强大的数据基础。
使用方法
使用SpatioTemporalYield数据集时,用户可以通过加载numpy数组和对应的json标签文件,快速获取特定年份和地理区域的玉米产量数据。数据集的结构化设计使得数据处理和模型训练变得高效,用户可以根据需要提取特定的时间序列和特征通道,进行深入的分析和建模。此外,数据集的开放性和多源数据融合特性,为跨学科研究提供了广阔的应用前景。
背景与挑战
背景概述
在确保粮食安全的关键背景下,作物产量信息的重要性日益凸显。随着地球观测技术的进步和历史产量记录的可用性,机器学习在产量预测中的应用得到了广泛关注。SpatioTemporalYield数据集由相关领域的研究人员创建,旨在通过比较研究探索县域级别产量预测中的时空编码策略。该数据集涵盖了美国五大玉米生产州(爱荷华州、伊利诺伊州、印第安纳州、内布拉斯加州和明尼苏达州),这些州在2021年占据了美国玉米总产量的一半以上。数据集包含了从2003年至2021年的时空数据,涵盖了46个时间序列和12个特征通道,为农业监测提供了多任务和多感官的基准数据集。
当前挑战
SpatioTemporalYield数据集在构建过程中面临多项挑战。首先,如何有效整合和编码时空信息以提高产量预测的准确性是一个核心问题。其次,不同实验设置下的研究结果难以进行直接比较,这要求数据集在设计上具备高度的标准化和一致性。此外,数据集的规模和复杂性也带来了存储和处理上的技术挑战。最后,随着农业监测需求的不断变化,数据集的持续更新和扩展也是一个重要的挑战,以确保其能够适应未来的研究需求。
常用场景
经典使用场景
SpatioTemporalYield数据集在农业领域中具有广泛的应用前景,尤其是在县域级别的玉米产量预测任务中。通过整合时间序列和空间信息,该数据集为研究人员提供了一个全面的框架,用于探索和比较不同的时空编码策略。其经典使用场景包括构建和评估基于机器学习的玉米产量预测模型,利用历史产量记录和地球观测技术,以提高预测的准确性和鲁棒性。
解决学术问题
SpatioTemporalYield数据集解决了农业领域中多个关键的学术研究问题。首先,它为研究人员提供了一个统一的实验平台,使得不同实验设置下的研究成果能够进行有效的比较和验证。其次,通过整合多源数据,如MOD9A1.061卫星影像和Daymet气象数据,该数据集有助于深入理解影响玉米产量的时空因素,从而推动农业监测和产量预测的科学研究。
衍生相关工作
SpatioTemporalYield数据集的发布激发了大量相关研究工作。例如,研究人员基于该数据集开发了多种时空编码模型,以提高玉米产量预测的准确性。此外,该数据集还被用于探索多任务学习在农业监测中的应用,如同时预测多个作物的产量和监测土壤质量。这些衍生工作不仅丰富了农业数据科学的研究内容,也为实际应用提供了新的技术支持。
以上内容由遇见数据集搜集并总结生成



