tempus_bench_trial

Hugging Face2026-05-06 更新2026-05-07 收录

下载链接：

https://huggingface.co/datasets/Smlcrm/tempus_bench_trial

下载链接

链接失效反馈

官方服务：

资源简介：

TempusBench（任务子集）是一个时间序列任务数据集，采用CSV格式存储，包含variable_name、timestamps、values和variable_type等字段。数据集包含多个配置（configs），每个配置对应一个基准任务文件夹。数据集的语言为英语，许可证为CC-BY-NC-ND-4.0。数据集适用于时间序列分析及相关任务。引用信息请参考TempusBench论文。数据集的上游来源可能涉及其他条款，详细信息请参考论文和来源列表。

TempusBench (task subset) is a time series task dataset stored in CSV format, containing fields such as variable_name, timestamps, values, and variable_type. The dataset includes multiple configurations (configs), each corresponding to a benchmark task folder. The dataset is in English and licensed under CC-BY-NC-ND-4.0. It is suitable for time series analysis and related tasks. For citation information, please refer to the TempusBench paper. The upstream sources of the dataset may involve other terms; for details, please refer to the paper and source list.

创建时间：

2026-05-05

原始信息汇总

数据集概述：TempusBench (tasks subset)

数据集名称：TempusBench (tasks subset)
数据集页面：https://huggingface.co/datasets/Smlcrm/tempus_bench_trial
语言：英语 (en)
许可证：CC-BY-NC-ND-4.0
介绍：该数据集是 TempusBench 的时间序列任务数据子集，包含多个基准任务。每个 CSV 文件遵循 TempusBench 格式（包含 variable_name, timestamps, values, variable_type 字段）。

任务分类与配置

数据集根据任务类型分为三个主要类别，每个类别下包含多个配置（config），每个配置对应一个具体的基准任务，并仅提供 train 分割。

covariate（协变量任务）

advertising_sales_covariate
building_manufacturing_covariate
california_energy_covariate
california_hourly_covariate
currency_dense_covariate
currency_monthly_covariate
cybersecurity_count_covariate
cybersecurity_software_covariate
gdp_noisy_covariate
gdp_years_covariate
mobility_transport_covariate
nifty_longest_covariate
nifty_minutes_covariate
nifty_nonstationary_covariate
nyc_covid_healthcare_covariate
solar_100_covariate
solar_500_covariate
solar_nature_covariate
stocks_continuous_covariate
stocks_daily_covariate
stocks_economics_covariate
stocks_real_covariate
weather_climate_covariate
weather_cyclical_covariate

multivariate（多变量任务）

baggage_100_multivariate
baggage_months_multivariate
baggage_sales_multivariate
batadal_software_multivariate
gold_india_continuous_multivariate
gold_india_dense_multivariate
gold_india_economics_multivariate
gold_india_real_multivariate
india_gold_days_multivariate
lt_stock_longest_multivariate
lt_stock_minutes_multivariate
madrid_count_multivariate
madrid_cyclical_multivariate
madrid_hours_multivariate
madrid_noisy_multivariate
madrid_transport_multivariate
nyc_covid_healthcare_multivariate
soil_500_multivariate
soil_nature_multivariate
split_smart_energy_multivariate
utah_manufacturing_multivariate

univariate（单变量任务）

absent_binary_univariate
chickenpox_dense_univariate
coinbase_days_univariate
coinbase_economics_univariate
delhi_climate_univariate
electricity_energy_univariate
employees_healthcare_univariate
federal_funds_weeks_univariate
german_houses_sales_univariate
german_quarterly_univariate
inventories_manufacturing_univariate
inventories_months_univariate
madrid_transport_univariate
occupancy_count_univariate
patient_sparse_univariate
power_consumption_years_univariate
retail_categorical_univariate
software_nonstationary_univariate
soil_nature_univariate
sw_job_postings_software_univariate
synthetic_additive2_univariate
synthetic_cyclic_univariate
synthetic_multiplicative_univariate
synthetic_nonstationary_univariate
web_traffic_univariate

数据文件格式

所有数据文件均为 CSV 格式，存储于 task_data/ 目录下，按类别（covariate、multivariate、univariate）和任务名组织。每个 CSV 文件包含以下列：

variable_name：变量名称
timestamps：时间戳
values：数值
variable_type：变量类型

引用说明

相关论文可参考：https://arxiv.org/pdf/2604.11529

许可说明

该数据集捆绑文件使用 CC-BY-NC-ND-4.0 许可证。个别时间序列可能继承上游许可条款，详情请参阅论文和原始数据来源列表。

搜集汇总

数据集介绍

构建方式

在时序预测领域，基准测试数据集的质量直接关系到模型评估的公正性与可靠性。TempusBench (tasks subset) 数据集精心构建了一套涵盖多领域、多变量的时序任务集合，其构建方式颇具匠心。该数据集的每个配置（config）对应一个独立的基准测试任务，通过YAML前端配置明确指定数据路径。数据文件统一采用CSV格式，并严格遵循统一的四列结构：`variable_name`（变量名称）、`timestamps`（时间戳）、`values`（观测值）以及`variable_type`（变量类型）。这一标准化设计确保了不同任务间的数据格式无缝兼容。数据集共包含超过60个任务，根据时序特性被有序划分为三大类别：协变量（covariate）任务，例如广告销售与GDP数据；多变量（multivariate）任务，例如行李处理与黄金价格序列；单变量（univariate）任务，包括合成数据与真实世界的交通流量等。每一类任务均覆盖了多种时间分辨率与统计特性，从而为模型提供丰富的测试场景。

特点

TempusBench 数据集最显著的特征在于其多维度的多样性与高度的标准化。首先，它横跨广告、建筑、能源、金融、医疗、交通以及气象等多个真实应用领域，涵盖了不同社会经济情景下的时序数据，使得模型评估不仅限于合成数据，更能反映现实世界的复杂性。其次，数据在时间粒度上展现出丰富的层次，从分钟级的高频数据（如nifty_minutes、lt_stock_minutes）到年度低频数据（如gdp_years），挑战模型在不同采样率下的适应能力。再者，数据集纳入了多种统计特性，包括季节性、趋势性、非平稳性与周期性，并引入精心设计的合成序列（如synthetic_additive2、synthetic_multiplicative）作为对照基线。此外，数据文件采用预划分的训练集形式，且所有系列均以标准化列格式呈现，极大简化了预处理流程，使研究者能够专注于模型架构的创新。该数据集采用CC-BY-NC-ND-4.0许可协议，在保障知识产权的同时促进了学术交流。

使用方法

使用 TempusBench 数据集进行模型评估与开发时，研究者可依照简洁的流程获取与加载数据。通过Hugging Face Datasets库，用户能够利用`load_dataset`函数并根据所需任务指定具体的配置名称（config_name）来加载数据。例如，加载广告销售协变量任务可调用`load_dataset('tempus_bench_trial', 'advertising_sales_covariate')`，加载多变量的黄金价格序列则指定`gold_india_continuous_multivariate`配置。每个配置的数据文件均以CSV格式存储在`train`分割中，包含统一的四列结构，因此可直接转化为Pandas DataFrame等常用数据结构进行后续处理。研究者可根据任务类型（协变量、多变量或单变量）灵活选择对应的配置，构建目标预测或分类任务。鉴于数据集仅提供训练集，典型的使用模式是在训练集上执行交叉验证或按时间顺序切分，以模拟真实的时间序列预测场景。鉴于数据集包含多种时间尺度和统计特性，建议在使用前对序列进行初步的平稳性检验与归一化处理，以适配不同模型（如Transformer、LSTM或经典统计模型）的输入要求。

背景与挑战

背景概述

TempusBench是一个面向时间序列预测的综合性基准数据集，由相关研究团队于2024年构建并发布，其研究成果以论文形式发表于arXiv（ID: 2604.11529）。该数据集旨在系统性地评估和推动时间序列预测模型的发展，覆盖了基于协变量的单变量、多变量预测任务，涉及广告、金融、能源、医疗保健、气象等多个领域的真实数据源。作为时间序列领域的重要资源，TempusBench通过标准化格式和多样化的任务配置，为研究者提供了一个公平、可复现的评估平台，有助于揭示不同模型在复杂实际场景中的泛化能力与局限性，显著提升了该领域的基准测试质量。

当前挑战

TempusBench所解决的领域挑战主要源于时间序列预测中数据的高度异质性与非平稳性，包括不同时间分辨率、缺失值、趋势周期成分以及多种外生协变量的存在，这些因素使得模型的鲁棒性评估变得尤为复杂。在构建过程中，该数据集面临了从多个异构上游数据源中清洗、对齐并统一格式的困难，需确保不同领域的时间序列在时间戳、变量类型和统计分布上具有可比性。此外，如何在保留原始系列统计特性的前提下，设计合理的任务划分策略以支持模型性能的严格比较，也是构建中的关键难点。

常用场景

经典使用场景

在时间序列分析的前沿研究中，TempusBench（任务子集）作为一个精心设计的基准数据集，其核心用途在于系统性地评估和比较各类时间序列预测模型的性能。该数据集囊括了来自广告销售、建筑制造、能源消耗、金融汇率、网络安全、宏观经济、交通流量、医疗保健、太阳能发电、股票市场及气象气候等多个关键领域的丰富时序数据。研究者常利用其涵盖的单变量、多变量以及带有协变量的多样化任务配置，来全面测试模型在面对不同频率、不同噪声水平、不同季节性模式及不同序列长度时的泛化能力与鲁棒性。这使得TempusBench成为衡量从传统统计模型（如ARIMA）到现代深度学习模型（如Transformer、LSTM及时间序列基础模型）预测准确性的黄金标准平台。

实际应用

在现实世界的商业与工业应用中，TempusBench数据集的实际价值得到了淋漓尽致的展现。在能源领域，它辅助构建高精度的短期用电负荷与太阳能发电预测模型，助力智能电网实现动态供需平衡与碳减排目标。在金融市场，该数据被用于开发股票价格指数（如NIFTY）及黄金价格的波动性预测系统，为量化交易与风险管理提供了可靠的算法验证基石。在供应链管理与交通运输中，借助其对马德里交通流量或机场行李处理量的建模支持，企业能够优化物流调度，减少异常拥堵与延误。此外，在公共卫生层面，针对纽约新冠疫情期间医疗资源需求的预测，TempusBench也贡献了关键的数据支撑，验证了时间序列模型在突发公共卫生事件应急响应中的巨大潜力。

衍生相关工作

围绕TempusBench数据集，学术界与工业界已衍生出一系列极具影响力的经典工作。这些工作主要集中在两个方向上：一是算法的极致化创新，二是面向特定领域的应用适配。在算法层面，研究者基于该基准集开发了一系列新型预训练时间序列基础模型，这些模型通过在海量异构任务上的元学习，展现了超越传统专有模型的零样本或少样本预测能力。同时，针对数据中普遍存在的异方差与分布漂移问题，出现了集成多重注意力机制与鲁棒损失函数的改进型Transformer架构。在应用层面，衍生工作成功将TempusBench中的日光能源与气候数据迁移至农业物候期预测，将股票市场协变量分析应用于反洗钱交易监测，这些跨界探索不仅拓展了数据集的学术影响边界，也验证了标准化的时序基准在解决实际复杂问题时的强大生命力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集