five

Time Series Library (TSLib)|时间序列分析数据集|实际应用数据集

收藏
arXiv2024-07-18 更新2024-07-22 收录
时间序列分析
实际应用
下载链接:
https://github.com/thuml/Time-Series-Library
下载链接
链接失效反馈
资源简介:
Time Series Library (TSLib)是由清华大学软件学院开发的一个综合性时间序列分析数据集,涵盖了30个不同领域的数据集,支持预测、分类、插补、异常检测等多种分析任务。数据集的创建过程结合了传统统计方法和先进的深度学习技术,旨在捕捉时间序列数据中的复杂时变模式和非线性关系。该数据集主要应用于金融风险评估、能源可持续性和天气预报等实际场景,旨在通过提供一个公平的基准来评估和识别现有模型的有效范围。
提供机构:
清华大学软件学院
创建时间:
2024-07-18
原始信息汇总

Time Series Library (TSLib) 数据集概述

数据集简介

TSLib 是一个开源库,专为深度学习研究人员设计,特别是用于深度时间序列分析。该库涵盖了五种主流任务:长期和短期预测、填补、异常检测和分类。

最新动态

  • 2024.07:发布了一篇关于深度时间序列模型的全面调查论文,基于TSLib进行严格的基准测试。
  • 2024.04:将著名的序列模型Mamba纳入库中。
  • 2024.03:将长期预测排行榜分为Look-Back-96和Look-Back-Searching两类。
  • 2023.10:添加了iTransformer的实现,这是长期预测的最新模型。
  • 2023.09:为TimesNet和该库添加了详细的教程,适合深度时间序列分析的初学者。
  • 2023.02:发布了TSLib,作为时间序列模型的综合基准和代码库。

排行榜

截至2024年3月,五个不同任务的顶级模型如下:

排名 长期预测<br>Look-Back-96 长期预测<br>Look-Back-Searching 短期预测 填补 分类 异常检测
🥇 1st iTransformer TimeMixer TimesNet TimesNet TimesNet TimesNet
🥈 2nd TimeMixer PatchTST Non-stationary Transformer Non-stationary Transformer Non-stationary Transformer FEDformer
🥉 3rd TimesNet DLinear FEDformer Autoformer Informer Autoformer

已包含的模型

以下模型已包含在TSLib中,并提供了代码链接:

  • TimeMixer
  • TSMixer
  • iTransformer
  • PatchTST
  • TimesNet
  • DLinear
  • LightTS
  • ETSformer
  • Non-stationary Transformer
  • FEDformer
  • Pyraformer
  • Autoformer
  • Informer
  • Reformer
  • Transformer
  • Mamba
  • SegRNN
  • Koopa
  • FreTS
  • TiDE
  • FiLM
  • MICN
  • Crossformer
  • TFT

使用方法

  1. 安装Python 3.8并执行以下命令安装依赖:

    pip install -r requirements.txt

  2. 准备数据,可以从Google Drive或Baidu Drive获取预处理好的数据集,并放置在./dataset文件夹中。

  3. 训练和评估模型,提供了实验脚本在./scripts/文件夹下,例如:

    bash ./scripts/long_term_forecast/ETT_script/TimesNet_ETTh1.sh

  4. 开发自己的模型,将模型文件添加到./models文件夹,并在Exp_Basic.model_dict中包含新模型,创建相应的脚本。

引用

如果发现该库有用,请引用相关论文:

@inproceedings{wu2023timesnet, title={TimesNet: Temporal 2D-Variation Modeling for General Time Series Analysis}, author={Haixu Wu and Tengge Hu and Yong Liu and Hang Zhou and Jianmin Wang and Mingsheng Long}, booktitle={International Conference on Learning Representations}, year={2023}, }

@article{wang2024tssurvey, title={Deep Time Series Models: A Comprehensive Survey and Benchmark}, author={Yuxuan Wang and Haixu Wu and Jiaxiang Dong and Yong Liu and Mingsheng Long and Jianmin Wang}, booktitle={arXiv preprint arXiv:2407.13278}, year={2024}, }

联系

如有任何问题或建议,请联系维护团队或通过Issues描述。

AI搜集汇总
数据集介绍
main_image_url
构建方式
Time Series Library (TSLib) is a benchmark developed to evaluate and compare deep time series models across various analysis tasks. It is composed of 24 mainstream models that are implemented and tested on 30 datasets spanning different domains. These datasets are carefully selected to cover a wide range of characteristics and complexities, ensuring that the benchmark can provide a comprehensive assessment of the models' performance. The library supports five prevalent analysis tasks, including forecasting, classification, imputation, and anomaly detection. The models in TSLib are categorized based on their backbone architecture, such as MLP-based, RNN-based, CNN-based, GNN-based, and Transformer-based, allowing users to choose the most suitable model for their specific tasks.
使用方法
To utilize TSLib, users can follow a straightforward workflow. Firstly, they need to select the appropriate dataset for their analysis task from the library's extensive collection. The dataset can be loaded and processed using the library's data processing functions, which include normalization, decomposition, and Fourier analysis. Once the data is prepared, users can choose a suitable deep time series model from the library's repository based on their specific requirements. The models are implemented with standardized interfaces, allowing for easy model creation and training. During the training process, users can specify the model parameters and evaluation metrics according to their needs. TSLib provides comprehensive logging and result storage functions, enabling users to track the training progress and evaluate the model's performance. Finally, users can utilize the library's evaluation protocols to assess the effectiveness and generalization of their trained models on different tasks. TSLib also offers visualization and analysis tools to help users interpret the results and gain insights into the behavior of their models.
背景与挑战
背景概述
时间序列数据,以其在离散时间顺序中排列的数据点序列为特征,在现实世界应用中无处不在。与图像和文本数据不同,时间序列数据的语义信息主要来源于时间变化。这种复杂的动态性质给时间序列数据的理解带来了独特的挑战,例如识别序列依赖性、趋势、季节性模式和复杂动态。近年来,时间序列分析领域取得了显著突破,技术从传统的统计方法转向了先进的深度学习模型。本文深入探讨了各种分析任务中深度时间序列模型的设计,并从两个角度回顾了现有文献:基本模块和模型架构。此外,我们开发和发布了时间序列库(TSLib)作为深度时间序列模型在不同分析任务中的公平基准,它实现了24个主流模型,涵盖了来自不同领域的30个数据集,并支持五种常见的分析任务。基于TSLib,我们深入评估了12个先进的深度时间序列模型在不同任务上的表现。实证结果表明,具有特定结构的模型非常适合不同的分析任务,这为研究和采用深度时间序列模型提供了见解。
当前挑战
时间序列数据由于其复杂和非线性的性质,对理解和分析带来了挑战。此外,构建一个公平和全面的深度时间序列模型基准也是一个挑战。当前的时间序列分析基准通常只覆盖特定的任务或领域,缺乏对不同模型架构和基准方法的详细讨论和总结。为了解决这些问题,我们引入了时间序列库(TSLib),它是一个公平的基准,可以比较和评估深度时间序列模型在各种时间序列分析任务中的性能。TSLib包括一个统一的模型实验管道、标准化的评估协议、广泛且多样化的真实世界数据集、主流和先进的深度时间序列分析模型,以及统一的实验验证和分析过程。TSLib提供了24个广泛使用和先进的深度时间序列分析模型,这些模型来自四种经典的深度学习架构。用户可以根据他们的具体应用场景从这些模型中进行选择。TSLib旨在促进对深度时间序列模型的研究和实际应用,为未来的研究和实际应用提供有用的起点代码和有价值的见解。
常用场景
经典使用场景
TSLib作为深度时间序列模型的一个公平基准,其最经典的使用场景是在不同的时间序列分析任务中评估和比较模型的性能。它支持包括预测、分类、插补和异常检测在内的五个常见分析任务,并包含了来自不同领域的30个数据集和24个主流模型。研究人员可以使用TSLib来评估和选择最适合他们特定任务的模型,从而提高预测的准确性和效率。
解决学术问题
TSLib解决了深度时间序列模型在公平性和全面性方面的评估问题。现有的基准通常只关注特定的分析任务或模型架构,而TSLib提供了一个全面且公平的评估环境,使得研究人员可以更准确地评估模型的性能和适用范围。此外,TSLib还提供了丰富的数据集和模型,有助于研究人员发现模型在不同任务中的优势和局限性,推动深度时间序列模型的研究和应用。
实际应用
TSLib在实际应用中可以帮助企业和研究人员选择和优化时间序列分析模型。它提供了一个统一的实验流程和评估协议,使得研究人员可以快速地评估模型的性能和适用性。此外,TSLib还包含了来自不同领域的真实数据集,使得模型可以更好地适应实际应用场景。例如,在金融领域,TSLib可以用于评估和选择股票价格预测模型,帮助企业做出更准确的金融决策。
数据集最近研究
最新研究方向
随着深度学习在时间序列分析领域的兴起,Time Series Library (TSLib) 作为一种公平的基准,涵盖了24种主流模型,支持五种常见的分析任务,为深度时间序列模型的研究和采用提供了新的视角。TSLib 的发布标志着时间序列分析从传统的统计方法转向先进的深度学习模型的重要转变。未来的研究方向包括时间序列预训练、大型时间序列模型的应用,以及解决处理极长序列、利用外生变量和异构数据的挑战。这些研究将有助于进一步推动时间序列分析领域的发展,并为实际应用提供更强大的模型和方法。
相关研究论文
  • 1
    Deep Time Series Models: A Comprehensive Survey and Benchmark清华大学软件学院 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集