DroughtSet
收藏arXiv2024-12-20 更新2024-12-21 收录
下载链接:
https://github.com/osu-srml/DroughtSet
下载链接
链接失效反馈官方服务:
资源简介:
DroughtSet是由俄亥俄州立大学创建的一个用于干旱预测的时空学习数据集,涵盖了2003年至2013年间美国大陆的多种气候和生态条件。该数据集整合了多个遥感和再分析数据集的相关预测特征和三种干旱指数,包括土壤湿度、蒸散压力指数和叶绿素荧光。数据集通过收集和预处理与干旱相关的预测因子,确保了地理分辨率的一致性,并提供了丰富的静态和动态变量。DroughtSet旨在为机器学习社区提供一个真实世界的数据集,用于基准测试干旱预测模型,并推动深度学习在气候科学中的应用。
DroughtSet is a spatiotemporal learning dataset for drought prediction developed by The Ohio State University. It covers diverse climatic and ecological conditions across the contiguous United States from 2003 to 2013. This dataset integrates relevant predictive features and three drought indices from multiple remote sensing and reanalysis datasets, including soil moisture, evapotranspiration stress index, and chlorophyll fluorescence. By collecting and preprocessing drought-related predictive factors, the dataset ensures consistent geographic resolution and provides a rich collection of static and dynamic variables. DroughtSet aims to offer the machine learning community a real-world dataset for benchmarking drought prediction models and advancing the application of deep learning in climate science.
提供机构:
俄亥俄州立大学
创建时间:
2024-12-20
搜集汇总
数据集介绍

构建方式
DroughtSet数据集通过整合美国本土(CONUS)多个遥感与再分析数据集的相关预测特征和三种干旱指数构建而成。该数据集涵盖了2003年至2013年间的气候、物理和植被条件,并将其统一重采样至4公里空间分辨率和每周时间分辨率。数据集包括静态变量(如海拔、冠层高度和土地覆盖类型)和动态变量(如降水、温度、叶面积指数等),并编译了三种干旱指数:土壤湿度干旱、生态水文干旱和生态干旱。通过这些数据的整合,DroughtSet为机器学习社区提供了一个用于干旱预测模型基准测试的现实世界数据集。
特点
DroughtSet数据集的特点在于其多维度的数据结构,涵盖了气候、物理和植被条件的静态与动态特征,并结合了三种干旱指数。该数据集不仅提供了丰富的时空信息,还通过多任务学习的方式支持同时预测多种干旱类型。此外,数据集的构建考虑了干旱的复杂物理和生物驱动因素,使其在干旱预测和时间序列预测任务中具有广泛的应用潜力。
使用方法
DroughtSet数据集可用于多种预测任务,包括多元时间序列预测、时空预测和不规则预测。用户可以通过该数据集训练模型,预测土壤湿度干旱、生态水文干旱和生态干旱三种干旱指数。数据集支持单变量预测任务,即从单一变量预测干旱指数,也支持多变量预测任务,即联合多个变量进行预测。此外,DroughtSet还适用于时空预测任务,利用空间和时间信息提升预测精度,并为不规则预测任务提供了静态和动态特征的联合使用。
背景与挑战
背景概述
DroughtSet是由俄亥俄州立大学的Xuwei Tan、Qian Zhao、Yanlan Liu和Xueru Zhang等人于2024年创建的一个专门用于干旱预测的时间序列数据集。该数据集整合了美国大陆(CONUS)2003年至2013年间的多种遥感数据和再分析数据,涵盖了与干旱相关的气候、物理和植被特征。DroughtSet的核心研究问题是如何通过深度学习技术,特别是时空学习模型,准确预测从亚季节性到季节性(S2S)时间尺度上的干旱。该数据集的发布旨在为机器学习社区提供一个真实世界的基准数据集,以推动干旱预测模型的研究,并为气候科学领域的深度学习应用提供新的工具。
当前挑战
DroughtSet在构建过程中面临了多个挑战。首先,干旱的复杂性在于其受到物理和生物驱动因素的复杂相互作用影响,尤其是在亚季节性到季节性时间尺度上,预测干旱的难度较大。其次,现有的干旱预测模型大多关注单一类型的干旱(如气象干旱、水文干旱或生态干旱),而忽略了它们之间的联合行为。此外,现有的数据驱动方法往往简化了不同因素之间的动态交互,限制了人工智能在提高干旱预测准确性方面的潜力。DroughtSet通过整合多源数据和多任务学习框架,试图解决这些挑战,但其复杂的数据结构和时空特征的融合仍为模型的构建和解释带来了技术难题。
常用场景
经典使用场景
DroughtSet 数据集的经典使用场景主要集中在干旱预测领域,特别是在亚季节性至季节性(S2S)时间尺度上的干旱预测。该数据集整合了多种遥感数据和再分析数据,提供了与干旱相关的气候、物理和植被特征,以及三种干旱指数(土壤湿度干旱、生态水文干旱和生态干旱)。通过这些数据,研究人员可以构建和验证基于机器学习的干旱预测模型,尤其是深度学习模型,以捕捉干旱的时空动态变化。
解决学术问题
DroughtSet 数据集解决了干旱预测中的多个学术研究问题,特别是在复杂的多因素交互作用下,如何准确预测干旱的发生和发展。传统的干旱预测模型通常依赖于单一的干旱类型或简化的生物驱动因素,而 DroughtSet 通过整合多源数据,提供了更全面的干旱预测框架。这不仅提高了干旱预测的准确性,还为研究人员提供了深入理解干旱对生物和物理条件的敏感性的工具,推动了气候科学领域的发展。
衍生相关工作
DroughtSet 数据集的发布催生了一系列相关的经典工作,特别是在深度学习和时空预测领域。基于该数据集,研究人员提出了多种干旱预测模型,如 SPDrought 模型,该模型通过融合时空信息,显著提升了干旱预测的准确性。此外,DroughtSet 还为其他领域的时空预测研究提供了基准,推动了多任务学习和可解释性方法在气候科学中的应用。这些衍生工作不仅丰富了干旱预测的研究方法,还为其他复杂时空数据集的分析提供了借鉴。
以上内容由遇见数据集搜集并总结生成



