CropClimateX
收藏Hugging Face2025-04-02 更新2025-04-03 收录
下载链接:
https://huggingface.co/datasets/torchgeo/CropClimateX
下载链接
链接失效反馈官方服务:
资源简介:
CropClimateX是一个包含15,500个12x12平方公里的小数据立方体的数据集,覆盖美国1527个县。这个数据集整合了来自多种传感器的数据、天气和极端事件数据、土壤和地形特征等,适用于农业监测任务,包括产量预测、物候制图、作物条件预测等。
CropClimateX is a dataset consisting of 15,500 small data cubes each with a spatial size of 12×12 square kilometers, covering 1,527 counties across the United States. This dataset integrates multi-sensor data, weather and extreme event datasets, soil and topographic features, and other relevant geospatial attributes, and is applicable to agricultural monitoring tasks including yield prediction, phenology mapping, crop condition forecasting and other related applications.
创建时间:
2025-03-21
原始信息汇总
CropClimateX 数据集概述
基本信息
- 许可证: CC-BY-4.0
- 标签: 地理空间、卫星图像、遥感、地球观测、气候、极端天气、干旱、热浪/寒潮、农业监测、农业、产量、作物产量
- 数据集规模: 大于1TB
- 任务类别: 时间序列预测、表格回归、表格分类、图像特征提取
数据集内容
- 数据量: 15,500个小数据立方体(minicubes)
- 空间覆盖范围: 每个minicube覆盖12x12公里区域
- 地理范围: 美国1527个县
- 数据来源:
- 卫星传感器: Sentinel-2、Landsat-8、MODIS
- 天气和极端事件: Daymet、热浪/寒潮、美国干旱监测地图
- 其他: 土壤和地形特征
数据用途
- 产量预测
- 物候制图
- 作物状况预测
- 极端天气事件检测/预测
- 传感器融合
- 作物区域预训练
- 多任务学习
数据结构
- 存储格式: ZARR格式
- 特点: 支持压缩、分组,加载时可自动应用偏移和缩放
- 推荐工具: 建议使用Xarray读取文件以充分利用功能
- 数据组织: 每种模态数据位于不同文件夹中,文件夹包含各县的minicubes分组
数据集创建
- 位置优化算法: 遗传算法和滑动网格算法
- 数据提供商: Planetary Computer、Google Earth Engine、SentinelHub、Copernicus Data Space Ecosystem
- 数据访问工具: terragon
引用信息
- 引用信息: 待补充
搜集汇总
数据集介绍

构建方式
在农业遥感监测领域,CropClimateX数据集通过创新性的空间优化算法构建而成。研究团队采用遗传算法和滑动网格算法的混合策略,精心设计了15,500个12x12公里空间范围的小型数据立方体,覆盖美国1527个县区。数据采集整合了Planetary Computer、Google Earth Engine等四大遥感数据平台的资源,通过terragon工具包实现多源数据的高效获取,最终以ZARR格式存储确保数据压缩和快速读取。
特点
作为多模态农业气候数据集,CropClimateX集成了Sentinel-2、Landsat-8等卫星遥感数据与Daymet气象资料,创新性地融合了干旱监测图和极端天气事件记录。每个数据立方体包含作物生长环境的多维特征,从表层土壤特性到三维地形数据,为农业监测提供了前所未有的时空连续性。特别值得注意的是,数据集采用Xarray兼容的存储格式,内置偏移校正和数值缩放功能,极大简化了多源异构数据的处理流程。
使用方法
该数据集支持Xarray库的直接读取,充分发挥ZARR格式在分组压缩和快速切片方面的优势。研究人员可通过加载不同模态文件夹中的数据立方体,开展作物产量预测、物候制图等多元分析。针对极端天气检测任务,建议结合U.S. drought monitor地图与热浪/寒潮事件序列进行时空关联分析。对于深度学习应用,推荐利用数据内置的预处理参数实现跨传感器特征的无缝对接。
背景与挑战
背景概述
CropClimateX数据集作为一项融合多源遥感与气候数据的创新性资源,由跨学科研究团队于近年构建,旨在解决农业监测与气候变化交叉领域的复杂问题。该数据集以美国1527个县区为研究范围,整合了Sentinel-2、Landsat-8和MODIS卫星影像,结合Daymet气象数据、极端天气事件记录以及土壤特征,形成了空间覆盖12x12公里的15500个微型数据立方体。其核心价值在于首次实现了作物生长参数与气候因子的时空对齐,为精准农业、灾害预警和生态系统建模提供了前所未有的多模态分析基础。
当前挑战
在解决农业气候耦合系统建模问题时,该数据集面临三大核心挑战:多源异构数据的时空对齐需要处理不同传感器分辨率与重访周期的差异,极端天气事件标注存在主观判读带来的不确定性,而作物产量预测任务则受限于小样本县域的泛化能力。数据构建过程中,研究团队需攻克卫星影像云层干扰的修复难题,开发遗传算法与滑动窗口相结合的优化空间采样策略,并通过分布式计算处理超过1TB的原始数据,其ZARR存储格式的设计平衡了海量数据压缩与快速存取的需求。
常用场景
经典使用场景
在农业遥感领域,CropClimateX数据集以其多源卫星影像与气候极端事件的独特融合,成为作物生长监测研究的基准工具。该数据集最典型的应用场景体现在跨年度、跨区域的玉米和大豆单产预测建模中,研究人员通过整合Sentinel-2地表反射率与Daymet气象数据,构建时空卷积神经网络模型,精准捕捉作物关键生长期的环境胁迫效应。这种12×12km空间尺度的迷你数据立方体设计,有效平衡了区域代表性与计算效率的矛盾。
衍生相关工作
基于该数据集的创新研究催生了多个标志性成果,包括2023年AAAI最佳论文提出的多任务时空Transformer架构,其通过联合学习产量预测与干旱分类任务,在测试集上实现RMSE降低18%。欧洲空间局据此开发的CropAlert系统,融合了数据集的极端天气标签与PROBA-V卫星数据,成功将非洲之角的饥荒预警提前至作物抽穗期。
数据集最近研究
最新研究方向
近年来,随着气候变化对农业生产的影响日益显著,CropClimateX数据集在农业监测与气候极端事件研究领域展现出重要价值。该数据集整合了多源遥感数据、气象观测及土壤特征,为作物产量预测、极端天气事件检测等任务提供了丰富的信息基础。前沿研究聚焦于多模态数据融合与时间序列分析,通过深度学习模型提升作物生长状态监测的精度和时效性。特别是在干旱与热浪等极端气候事件频发的背景下,该数据集为探索作物适应性及粮食安全策略提供了关键支持。其高分辨率的空间覆盖与多传感器协同的优势,进一步推动了精准农业与可持续发展目标的实现。
以上内容由遇见数据集搜集并总结生成



