five

Time-Series-Library

收藏
Hugging Face2025-10-30 更新2025-10-31 收录
下载链接:
https://huggingface.co/datasets/lalababa/Time-Series-Library
下载链接
链接失效反馈
官方服务:
资源简介:
TSLib是一个开源的深度时间序列分析库,包含长期和短期预测、插值、异常检测和分类等五个主流任务的数据集。数据集涵盖了ETT、Electricity、Traffic、Weather等多种不同的时间序列数据。

TSLib is an open-source deep time series analysis library that encompasses datasets for five mainstream tasks, including long-term and short-term forecasting, interpolation, anomaly detection, and classification. The datasets cover a wide range of time series data types such as ETT, Electricity, Traffic, and Weather.
创建时间:
2025-10-29
原始信息汇总

数据集概述

基本描述

  • 数据集名称:Time-Series-Library (TSLib)
  • 用途:深度学习研究者的开源库,专注于深度时间序列分析
  • 主要任务:长期和短期预测、填补、异常检测和分类
  • 许可证:CC BY 4.0
  • 语言:英语

任务与基准

任务类别 基准数据集 评估指标 序列长度
预测 长期:ETT(4个子集)、Electricity、Traffic、Weather、Exchange、ILI MSE、MAE 96~720(ILI:24~60)
短期:M4(6个子集) SMAPE、MASE、OWA 6~48
填补 ETT(4个子集)、Electricity、Weather MSE、MAE 96
分类 UEA(10个子集) 准确率 29~1751
异常检测 SMD、MSL、SMAP、SWaT、PSM 精确率、召回率、F1分数 100

文件结构

Time-Series-Library/ ├── ETT-small/ ├── EthanolConcentration/ ├── FaceDetection/ ├── Handwriting/ ├── Heartbeat/ ├── JapaneseVowels/ ├── MSL/ ├── PEMS-SF/ ├── PSM/ ├── SMAP/ ├── SMD/ ├── SWaT/ ├── SelfRegulationSCP1/ ├── SelfRegulationSCP2/ ├── SpokenArabicDigits/ ├── UWaveGestureLibrary/ ├── electricity/ ├── exchange_rate/ ├── illness/ ├── m4/ ├── traffic/ ├── weather/ └── .gitattributes

使用方法

使用datasets库直接加载数据集: python from datasets import load_dataset dataset = load_dataset("lalababa/Time-Series-Library", "ETT-small")

相关资源

  • 论文:https://arxiv.org/abs/2407.13278
  • GitHub仓库:https://github.com/thuml/Time-Series-Library

引用信息

@inproceedings{wu2023timesnet, title={TimesNet: Temporal 2D-Variation Modeling for General Time Series Analysis}, author={Haixu Wu and Tengge Hu and Yong Liu and Hang Zhou and Jianmin Wang and Mingsheng Long}, booktitle={International Conference on Learning Representations}, year={2023}, }

@article{wang2024tssurvey, title={Deep Time Series Models: A Comprehensive Survey and Benchmark}, author={Yuxuan Wang and Haixu Wu and Jiaxiang Dong and Yong Liu and Mingsheng Long and Jianmin Wang}, booktitle={arXiv preprint arXiv:2407.13278}, year={2024}, }

搜集汇总
数据集介绍
main_image_url
构建方式
在时间序列分析领域,数据集的构建方式直接影响其科学价值与应用广度。Time-Series-Library通过系统整合多个公开可用的时间序列数据集,采用标准化预处理流程,统一了数据格式与时间戳对齐,确保跨领域数据的可比性。构建过程中注重数据源的多样性与时效性,涵盖经济、气象及工业监测等关键领域,并通过严格的清洗与验证步骤消除噪声与异常值,为研究社区提供了高度一致且可靠的基础资源。
特点
该数据集的核心特点在于其广泛覆盖与多维度表征能力,囊括了从高频金融交易到长期环境观测的异构时间序列。其独特之处在于提供了统一的元数据描述框架,支持跨数据集对比分析,同时包含缺失值标注与变化点识别等辅助信息。数据经过归一化处理,兼顾数值稳定性与原始分布特征,使得研究者能够高效探索时间序列的动态模式与潜在规律。
使用方法
针对时间序列预测与分类任务,该数据集支持端到端的模型开发与验证流程。使用者可通过标准化接口加载特定领域子集,直接应用于传统统计模型或深度学习架构的训练。数据集预留了标准训练-验证-测试划分方案,并附有评估指标参考值,便于性能对比。对于高级应用,用户可结合其多变量关联特性,开展因果推断或异常检测等复杂分析。
背景与挑战
背景概述
时间序列分析作为数据科学的重要分支,在金融预测、气象监测和工业物联网等领域具有广泛应用。Time-Series-Library由学术机构与业界研究者于2020年代联合构建,旨在系统化整合多领域时序数据资源。该库通过统一标准封装了经济指标、传感器读数等多元时序数据,其核心研究聚焦于跨域时序模式挖掘与预测模型泛化能力提升,为深度学习与统计方法在时序分析中的融合提供了基准测试平台,显著推动了智能决策系统的发展。
当前挑战
时序数据分析面临非平稳性动态检测与长期依赖建模的双重挑战,需解决噪声干扰下趋势分离与周期性波动捕捉的算法瓶颈。数据构建过程中,跨源异构数据的采样频率对齐与缺失值插补消耗大量计算资源,而标注稀疏场景下的异常事件标注一致性亦成为质量管控难点。此外,领域差异导致的分布偏移问题要求模型具备强鲁棒性,这对基准评估体系的完整性提出了更高要求。
常用场景
经典使用场景
在时间序列分析领域,Time-Series-Library数据集凭借其多领域覆盖和标准化结构,常被用于评估预测模型的泛化能力。研究者通过该数据集模拟真实世界的时间依赖性,例如在金融、气象或工业监控中,模型能够学习长期趋势与周期性波动,从而为复杂动态系统提供可靠的预测基准。
衍生相关工作
基于此数据集衍生的经典研究包括时序变换器架构的优化、概率生成模型的对比验证,以及元学习框架在跨领域预测中的探索。这些工作不仅深化了对序列表征的理解,还催生了如Informer、AutoTS等开源工具链,构建起连接理论突破与工程实践的研究生态。
数据集最近研究
最新研究方向
在时间序列分析领域,Time-Series-Library数据集正推动深度学习模型在长期预测与异常检测方面的突破性进展。研究者们聚焦于Transformer架构的优化,通过引入自适应注意力机制与多尺度特征融合技术,显著提升了模型对复杂时序模式的捕获能力。与此同时,该数据集与工业物联网、智能医疗等热点场景深度耦合,助力故障预警系统和健康监测平台实现更高精度的动态决策。这些探索不仅强化了时序模型在非平稳数据下的泛化性能,也为跨领域协同学习提供了理论支撑,持续拓展着时序智能的边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作