torchgeo/CropClimateX
收藏Hugging Face2026-02-08 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/torchgeo/CropClimateX
下载链接
链接失效反馈官方服务:
资源简介:
CropClimateX数据集包含了15,500个覆盖12x12km空间的小数据立方体,覆盖了美国1527个县。这些数据立方体集成了来自多个传感器(Sentinel-2、Landsat-8、MODIS)的数据、天气和极端事件数据(Daymet、冷暖波、美国干旱监测图)、土壤和地形特征,适合用于各种农业监测任务,如产量预测、物候映射、作物状况预测等。
The CropClimateX dataset includes 15,500 small data cubes, each covering a 12x12km area, spanning 1527 counties in the United States. These data cubes integrate information from multiple sensors (Sentinel-2, Landsat-8, MODIS), weather and extreme event data (Daymet, heat/cold waves, and U.S. Drought Monitor maps), as well as soil and terrain features, making it suitable for various agricultural monitoring tasks such as yield prediction, phenology mapping, and crop condition forecasting.
提供机构:
torchgeo
搜集汇总
数据集介绍

构建方式
在农业遥感与气候监测交叉领域,CropClimateX数据集通过多源数据融合策略,系统性地整合了美国1527个县2018至2022年的时空信息。其构建过程采用遗传算法与滑动网格算法优化采样位置,形成15500个12×12公里的小型数据立方体(minicubes),每个立方体汇集了来自Sentinel-1/2、Landsat-8、MODIS等多颗卫星的影像,以及Daymet气象数据、热浪/寒潮极端事件记录、美国干旱监测地图,并补充了土壤与地形特征。数据通过Planetary Computer、Google Earth Engine、SentinelHub等平台获取,借助terragon工具实现API高效调用,最终以ZARR格式存储,支持压缩与分组,确保大规模地理空间数据的高效访问与处理。
特点
该数据集的核心特点在于其多任务与多模态的协同设计。它首次将作物监测与气候感知任务统一于一个连贯框架内,涵盖产量预测、物候映射、作物状况预报、极端天气事件检测与预测、传感器融合及预训练等多种应用场景。每个minicube内嵌了时间序列的遥感、气象、土壤与地形信息,数据量超过1TB,规模宏大。其空间覆盖广泛,时间跨度连续五年,且通过整合干旱指数等衍生数据,增强了模型对气候胁迫的响应能力。这种结构不仅支持单任务学习,还特别适合多任务学习与跨模态迁移,为农业遥感领域的深度学习研究提供了高保真、标准化的数据基础。
使用方法
使用该数据集时,推荐采用Xarray库加载ZARR格式文件以充分利用其内置的偏移与缩放自动处理功能。数据按模态分文件夹存储,每个县对应的minicube以分组形式组织,便于按需访问特定区域或传感器组合。研究者可针对不同任务灵活选取子集,例如使用时间序列数据进行作物产量回归,或结合遥感与气候标签进行极端事件分类。数据集还支持图像特征提取与预训练,用户可通过官方GitHub仓库获取示例代码与详细文档,并依据CC-BY-4.0许可自由使用,引用时需注明原始论文以保障学术规范。
背景与挑战
背景概述
CropClimateX是由慕尼黑工业大学Adrian Höhl、Stella Ofori-Ampofo等研究人员于2026年创建的大规模、多任务、多传感器数据集,旨在应对气候变化对农业监测带来的严峻挑战。该数据集聚焦于2018至2022年间美国1527个县,整合了Sentinel-1/2、Landsat-8、MODIS等卫星影像、Daymet气象数据、极端天气事件(如热浪、寒潮)、干旱监测图以及土壤地形特征,形成了15,500个12×12公里的数据立方体。通过融合作物生长与气候相关任务,CropClimateX为时间序列预测、表格回归与分类、图像特征提取等提供了统一基准,其发布在《Scientific Data》上,显著推动了农业遥感与气候智能监测领域的交叉研究。
当前挑战
CropClimateX所解决的领域挑战在于,现有农业监测数据集通常仅关注单一任务(如产量预测或物候制图),缺乏多模态、多任务协同学习的能力,且难以有效捕捉极端气候事件对作物生长的动态影响。在构建过程中,研究人员面临多重困难:首先,从Planetary Computer、Google Earth Engine等多个数据源获取并同步来自不同传感器(如Sentinel-1/2与MODIS)的异构数据,需解决时空分辨率不匹配与数据缺失问题;其次,采用遗传算法与滑动网格算法优化数据立方体位置,以兼顾覆盖效率与计算负载;此外,整合干旱指数等衍生数据需额外标注与验证,确保多任务学习标签的一致性。
常用场景
经典使用场景
CropClimateX数据集最经典的使用场景在于融合多源遥感、气象与土壤数据,构建面向作物监测的时空预测模型。该数据集以1527个美国县域内12×12公里的“迷你立方体”为基本单元,整合了Sentinel-1/2、Landsat-8、MODIS等卫星影像,Daymet气象变量、热浪/寒潮极端事件、美国干旱监测图,以及数字高程模型和土壤属性,从而支持作物产量预测、物候期识别与生长状态评估等核心任务。其多模态、多任务的结构设计,使得研究者能够同时探索时序回归、分类与图像特征提取问题,为农业遥感领域提供了标准化的基准平台。
衍生相关工作
基于CropClimateX,衍生出了一系列具有影响力的经典工作。例如,研究者利用其多传感器特性提出了基于对比学习的无监督预训练方法,在作物分类与产量回归任务上取得了显著性能提升;另有工作构建了时序Transformer模型,联合预测极端天气事件与作物状态,验证了跨任务迁移学习的有效性。此外,该数据集促进了多模态融合算法的开发,如将Sentinel-1雷达后向散射系数与MODIS植被指数结合,提升了干旱胁迫监测的鲁棒性。这些衍生研究不仅拓展了遥感与气候科学的交叉边界,也推动了开放科学背景下大规模基准数据集的设计范式。
数据集最近研究
最新研究方向
在全球气候变化加剧与粮食安全风险攀升的背景下,农业生产对精细化、多模态数据的需求日益迫切。CropClimateX数据集应运而生,其整合了2018至2022年间美国1527个县的卫星遥感、气象极端事件、土壤地形等多源时空信息,构建了12×12公里尺度的标准化数据立方体。该数据集的前沿研究聚焦于气候智能型农业监测,尤其在作物产量预测、物候识别及极端天气检测等任务中展现出强大的多任务学习与传感器融合潜力。通过将干旱、热浪等气候胁迫因子与作物生长状态直接关联,该数据集为构建可解释的农业决策支持系统提供了关键基准,推动了遥感与气候科学在精准农业中的交叉融合,对应对全球粮食系统脆弱性具有重要科学价值与实践意义。
以上内容由遇见数据集搜集并总结生成



