统一长期时间序列预测基准数据集

Name: 统一长期时间序列预测基准数据集
Creator: 华沙大学信息学院
Published: 2023-09-28 02:59:00
License: 暂无描述

arXiv2023-09-28 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2309.15946v1

下载链接

链接失效反馈

官方服务：

资源简介：

统一长期时间序列预测基准数据集是由华沙大学信息学院的Jacek Cyranka和Szymon Haponiuk创建，专门设计用于长期时间序列预测的全面数据集。该数据集包含来自多样化动态系统和真实生活记录的多个数据集，每个数据集被标准化分为训练和测试轨迹，具有预定的回顾长度。数据集包括长达2000个时间步长的轨迹，确保对长期预测能力的可靠评估。通过提供这一统一数据集，旨在实现对长期时间序列预测方法的公平和全面评估，促进对这些方法在不同领域中优势和劣势的深入理解。该数据集在实际应用中，如天气预报、股市趋势预测或模型预测控制设计中的机器人行为预测等方面具有高度价值。

The Unified Long-Term Time Series Forecasting Benchmark Dataset was developed by Jacek Cyranka and Szymon Haponiuk from the Faculty of Informatics, University of Warsaw, and is purpose-built as a comprehensive dataset for long-term time series forecasting. This dataset includes multiple subsets sourced from diverse dynamic systems and real-world recordings. Each subset is standardizedly split into training and test trajectories with a preset lookback length. The dataset features trajectories of up to 2000 time steps, ensuring reliable evaluation of long-term forecasting performance. By releasing this unified benchmark, the aim is to enable fair and comprehensive assessment of long-term time series forecasting methods, and to facilitate in-depth understanding of the strengths and limitations of these methods across various domains. This dataset holds substantial practical value in real-world applications such as weather forecasting, stock market trend prediction, and robot behavior prediction for model predictive control design, among others.

提供机构：

华沙大学信息学院

创建时间：

2023-09-28

搜集汇总

数据集介绍

构建方式

在时间序列预测研究领域，现有基准数据集多局限于单一领域或存在标准化不足的问题。为弥补这一缺陷，该数据集系统性地整合了来自多类动态系统的数据资源，涵盖机器人仿真、偏微分方程、确定性混沌动力学以及真实世界记录等不同领域。每个数据集均被严格划分为训练轨迹与测试轨迹，并预设了固定的回溯窗口长度，其中合成数据集的每条轨迹均独立生成且无重叠，而真实数据则通过滑动窗口技术从长序列中切分而来。所有数据以HDF5格式存储，并基于训练集统计量进行标准化处理，从而确保评估过程的一致性与可复现性。

特点

该基准数据集在规模与多样性上均超越了现有同类资源，压缩后大小超过100GB，显著高于此前最大的时间序列数据集。其核心特色在于融合了长度可达2000时间步的长轨迹与维度高达256的高维状态空间，同时覆盖了确定性、随机性以及混沌动力学等多样化动态特征。此外，数据集为每项任务预设了短、中、长三种不同难度的回溯窗口长度，以全面检验模型在不同信息量下的泛化能力。这种设计使得该基准能够有效区分模型在简单信号与复杂动态系统上的表现差异。

使用方法

在应用该数据集时，研究者需依据提供的回溯窗口长度从轨迹中截取历史片段作为输入，并预测后续等长的未来序列。数据集以HDF5格式提供未归一化的原始数据，用户可在加载过程中利用训练集的均值和标准差进行标准化。为便于模型评估，所有合成数据集均包含18,000条训练轨迹与2,000条测试轨迹，而真实数据集则通过重叠切分生成大量子序列。该基准还配套提供了基于PyTorch的开源工具库，其中集成了LSTM、DeepAR、NLinear、PatchTST等主流模型的标准化实现，并支持用户自定义配置以进行公平的性能对比。

背景与挑战

背景概述

时间序列预测作为当代数据分析的核心任务，在战略规划、资源分配及风险管控等众多领域具有广泛应用。然而，现有长期预测基准数据集普遍存在规模有限、领域覆盖单一及标准化缺失等问题，严重制约了机器学习方法的公平评估与性能泛化研究。针对这一困境，华沙大学信息学研究所的Jacek Cyranka与Szymon Haponiuk于2023年构建了统一长期时间序列预测基准数据集。该数据集创造性地整合了来自机器人仿真、偏微分方程、混沌动力学及真实记录等多源异构数据，包含超过100GB的标准化轨迹数据，每个轨迹长度可达2000时间步。通过提供预设的历史窗口长度与训练/测试划分，该基准为长期预测模型的系统性评估奠定了坚实基础，在时间序列分析领域产生了重要影响。

当前挑战

该数据集面临的核心挑战首先在于领域问题的复杂性：长期预测任务需同时应对混沌系统的高敏感性、高维空间的高效编码以及随机过程的趋势捕捉等多重困难，现有模型在跨域泛化时表现参差不齐。其次，构建过程遭遇显著困难：合成数据生成需确保每个轨迹独立且不重叠以测试模型表达力，而真实数据则需通过重叠子轨迹进行标准化处理；不同领域数据的最优回溯窗口长度差异悬殊，从短至2步到长达2000步不等，这直接影响了模型编码历史信息的难度。此外，部分模型在处理高维状态空间时参数爆炸，导致训练不可行，进一步加剧了基准评估的挑战。

常用场景

经典使用场景

在时间序列预测领域，该数据集被广泛用于评估和比较不同深度学习模型在长期预测任务上的性能。研究人员通常利用其多样化的子数据集——涵盖正弦波、混沌动力系统（如洛伦兹和Mackey-Glass）、随机过程（如Lotka-Volterra）以及高维偏微分方程（如Kuramoto-Sivashinsky和Cahn-Hillard）——来测试模型对规则周期、混沌行为、随机波动及高维空间模式的适应能力。通过设定不同的回溯窗口长度（从短至1步到长达2000步），该基准为模型在多种难度级别下的泛化能力提供了标准化测试平台，尤其适合检验模型在极端长程预测中的鲁棒性。

实际应用

在实际应用中，该数据集为多个关键领域提供了直接的决策支持。在气象学中，通过混沌系统（如洛伦兹方程）的预测能力，可间接评估模型用于长期天气预报的潜力。在机器人控制领域，MuJoCo模拟数据（涵盖半猎豹、步行者和跳跃机器人）可用于训练模型预测刚体动力学行为，进而优化模型预测控制（MPC）策略。在能源管理方面，ETT和电力数据集的长程预测能力有助于电网负荷调度和资源规划。此外，交通流量数据（PEMS-BAY）支持智能交通系统中的拥堵预测与路线优化，而金融时间序列（M4）则服务于股票市场的长期趋势分析。这些实际场景均受益于该基准对模型在长回溯窗口和大状态维度下的严格检验。

衍生相关工作

该数据集的出现催生了多项重要的衍生工作。其中，研究者提出了改进的DeepAR+课程学习（CL）模型和潜在NLinear模型，两者在多数场景下显著超越了原始版本，为长程预测提供了更强的基线。此外，该基准激发了针对高维稀疏数据的模型设计，例如将线性模型扩展至潜在空间以处理PDE问题。在评估方法论上，基于该数据集的研究推动了“模型-数据匹配度”分析框架的发展，促使学界重新审视传统递归网络与新兴Transformer架构的优劣。同时，该基准的开源PyTorch库为后续工作提供了标准化工具，促进了如PatchTST和SpaceTime等模型在多样化场景下的复现与比较，进而加速了长程时间序列预测领域的算法迭代。

以上内容由遇见数据集搜集并总结生成