chronos_datasets
收藏Hugging Face2024-06-27 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/autogluon/chronos_datasets
下载链接
链接失效反馈官方服务:
资源简介:
Chronos数据集是一系列专为时间序列预测任务设计的数据集,涵盖了单变量和多变量时间序列预测。每个数据集配置(如'dominick'、'electricity_15min'等)都详细描述了其特征,包括数据类型和是否为序列,以及训练集的示例数量和字节数。此外,每个数据集都提供了许可证信息和主页链接,指明了数据的使用权限和原始来源。
The Chronos Dataset is a collection of datasets tailored specifically for time series forecasting tasks, covering both univariate and multivariate time series forecasting. Each dataset configuration (e.g., "dominick", "electricity_15min", etc.) details its characteristics, including data type, whether the dataset is sequential, the number of training samples, and the size in bytes. Additionally, each dataset provides license information and a homepage link, specifying the data usage permissions and original source.
创建时间:
2024-06-22
原始信息汇总
Chronos 数据集概述
数据集基本信息
- 数据集名称: Chronos datasets
- 任务类别: 时间序列预测
- 任务ID:
- 单变量时间序列预测
- 多变量时间序列预测
- 许可证: 多种许可证,包括 CC BY 4.0、MIT 等
- 数据来源: 原始数据
- 注释创建者: 无注释
数据集配置详情
dominick
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列im_0: 整数(64位)
- 分割:
train: 477,140,250 字节, 100,014 样本
- 下载大小: 60,199,910 字节
- 数据集大小: 477,140,250 字节
- 主页: https://www.chicagobooth.edu/research/kilts/research-data/dominicks
electricity_15min
- 特征:
id: 字符串timestamp: 时间戳(毫秒)consumption_kW: 浮点数序列
- 分割:
train: 670,989,988 字节, 370 样本
- 下载大小: 284,497,403 字节
- 数据集大小: 670,989,988 字节
- 许可证: CC BY 4.0
- 主页: https://archive.ics.uci.edu/dataset/321/electricityloaddiagrams20112014
ercot
- 特征:
id: 字符串timestamp: 时间戳(纳秒)target: 浮点数序列(32位)
- 分割:
train: 8 样本
- 下载大小: 14,504,261 字节
exchange_rate
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列(32位)
- 分割:
train: 8 样本
- 下载大小: 401,501 字节
- 许可证: MIT
- 主页: https://github.com/laiguokun/multivariate-time-series-data/tree/master/exchange_rate
m4_daily
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列category: 字符串
- 分割:
train: 160,504,176 字节, 4,227 样本
- 下载大小: 65,546,675 字节
- 数据集大小: 160,504,176 字节
- 主页: https://github.com/Mcompetitions/M4-methods
m4_hourly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列category: 字符串
- 分割:
train: 5,985,544 字节, 414 样本
- 下载大小: 1,336,971 字节
- 数据集大小: 5,985,544 字节
- 主页: https://github.com/Mcompetitions/M4-methods
m4_monthly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列category: 字符串
- 分割:
train: 181,372,969 字节, 48,000 样本
- 下载大小: 52,772,258 字节
- 数据集大小: 181,372,969 字节
- 主页: https://github.com/Mcompetitions/M4-methods
m4_quarterly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列category: 字符串
- 分割:
train: 39,205,397 字节, 24,000 样本
- 下载大小: 13,422,579 字节
- 数据集大小: 39,205,397 字节
- 主页: https://github.com/Mcompetitions/M4-methods
m4_weekly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列category: 字符串
- 分割:
train: 5,955,806 字节, 359 样本
- 下载大小: 2,556,691 字节
- 数据集大小: 5,955,806 字节
- 主页: https://github.com/Mcompetitions/M4-methods
m4_yearly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列category: 字符串
- 分割:
train: 14,410,042 字节, 23,000 样本
- 下载大小: 5,488,601 字节
- 数据集大小: 14,410,042 字节
- 主页: https://github.com/Mcompetitions/M4-methods
m5
- 特征:
id: 字符串timestamp: 时间戳(毫秒)item_id: 字符串target: 浮点数序列(32位)dept_id: 字符串cat_id: 字符串store_id: 字符串state_id: 字符串
- 分割:
train: 574,062,630 字节, 30,490 样本
- 下载大小: 78,063,286 字节
- 数据集大小: 574,062,630 字节
- 主页: https://www.kaggle.com/competitions/m5-forecasting-accuracy/rules
mexico_city_bikes
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 618,999,406 字节, 494 样本
- 下载大小: 103,206,946 字节
- 数据集大小: 618,999,406 字节
- 主页: https://ecobici.cdmx.gob.mx/en/open-data/
monash_australian_electricity
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 18,484,319 字节, 5 样本
- 下载大小: 16,856,156 字节
- 数据集大小: 18,484,319 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_car_parts
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 2,232,790 字节, 2,674 样本
- 下载大小: 70,278 字节
- 数据集大小: 2,232,790 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_cif_2016
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 115,096 字节, 72 样本
- 下载大小: 70,876 字节
- 数据集大小: 115,096 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_covid_deaths
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 907,326 字节, 266 样本
- 下载大小: 58,957 字节
- 数据集大小: 907,326 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_electricity_hourly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 135,103,443 字节, 321 样本
- 下载大小: 31,139,117 字节
- 数据集大小: 135,103,443 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_electricity_weekly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 807,315 字节, 321 样本
- 下载大小: 333,563 字节
- 数据集大小: 807,315 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_fred_md
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 1,248,369 字节, 107 样本
- 下载大小: 412,207 字节
- 数据集大小: 1,248,369 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_hospital
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 整数(64位)
- 分割:
train: 767 样本
- 下载大小: 117,038 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_kdd_cup_2018
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列city: 字符串station: 字符串measurement: 字符串
- 分割:
train: 47,091,540 字节, 270 样本
- 下载大小: 8,780,105 字节
- 数据集大小: 47,091,540 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_london_smart_meters
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 2,664,567,976 字节, 5,560 样本
- 下载大小: 597,389,119 字节
- 数据集大小: 2,664,567,976 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_m1_monthly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 907,691 字节, 617 样本
- 下载大小: 244,372 字节
- 数据集大小: 907,691 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_m1_quarterly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 162,961 字节, 203 样本
- 下载大小: 48,439 字节
- 数据集大小: 162,961 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_m1_yearly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 75,679 字节, 181 样本
- 下载大小: 30,754 字节
- 数据集大小: 75,679 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_m3_monthly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 2,708,124 字节, 1,428 样本
- 下载大小: 589,699 字节
- 数据集大小: 2,708,124 字节
- 许可证: CC BY 4.0
- 主页: https://zenodo.org/communities/forecasting
monash_m3_quarterly
- 特征:
id: 字符串timestamp: 时间戳(毫秒)target: 浮点数序列
- 分割:
train: 606,428 字节, 756 样本
- 下载大小: 188,543 字节
- 数据集大小: 606,428
搜集汇总
数据集介绍

构建方式
Chronos数据集是一个专注于时间序列预测的综合性数据集,涵盖了多个领域的实际应用场景。该数据集通过整合来自不同来源的原始数据,确保了数据的多样性和广泛性。每个子数据集都经过精心处理,包含时间戳、目标变量以及其他相关特征,确保数据的完整性和可用性。数据集的构建过程严格遵循时间序列数据的处理标准,确保了数据的时间一致性和准确性。
特点
Chronos数据集的特点在于其广泛的应用领域和丰富的数据类型。数据集涵盖了从电力消耗、汇率变化到交通流量等多个领域的时间序列数据,且每个子数据集都提供了详细的元数据信息,如时间戳、目标变量等。此外,数据集还支持单变量和多变量时间序列预测任务,能够满足不同研究需求。数据集的多样性和高质量使其成为时间序列预测领域的理想选择。
使用方法
Chronos数据集的使用方法灵活多样,适用于多种时间序列预测任务。用户可以通过HuggingFace平台轻松下载和加载数据集,并根据具体需求选择不同的子数据集进行实验。数据集提供了详细的文档和示例代码,帮助用户快速上手。研究人员可以利用该数据集进行模型训练、验证和测试,探索不同时间序列预测算法的性能。此外,数据集的开源特性也便于用户进行二次开发和扩展。
背景与挑战
背景概述
Chronos数据集是一个专注于时间序列预测的多领域数据集集合,涵盖了从电力消耗到交通流量等多种时间序列数据。该数据集由多个子集组成,如M4、M5等,这些子集源自不同的研究机构和公开数据源,旨在为时间序列预测领域的研究提供丰富的数据支持。Chronos数据集的创建时间不详,但其核心研究问题集中在单变量和多变量时间序列预测上,广泛应用于金融、能源、交通等领域。该数据集的影响力体现在其为时间序列预测模型的开发与评估提供了标准化的基准,推动了相关领域的研究进展。
当前挑战
Chronos数据集在解决时间序列预测问题时面临多重挑战。首先,时间序列数据通常具有复杂的非线性特征和季节性变化,如何准确捕捉这些特征并构建有效的预测模型是一个关键难题。其次,数据集中包含的多个子集来自不同的领域,数据格式和特征差异较大,如何统一处理这些异构数据并提取有用的信息是另一个挑战。此外,构建过程中还面临数据质量不一、缺失值处理、噪声过滤等问题,这些问题直接影响模型的训练效果和预测精度。因此,如何在保证数据质量的同时,设计出能够适应不同领域需求的通用预测模型,是Chronos数据集面临的核心挑战。
常用场景
经典使用场景
Chronos数据集在时间序列预测领域具有广泛的应用,尤其是在单变量和多变量时间序列预测任务中。该数据集通过提供丰富的时序数据,帮助研究人员开发和验证各种预测模型。例如,电力消耗、汇率波动、交通流量等场景中,Chronos数据集能够为模型训练提供高质量的时间序列数据,从而提升预测的准确性。
解决学术问题
Chronos数据集解决了时间序列预测中的多个关键学术问题,如长期依赖性问题、非线性趋势捕捉以及多变量之间的复杂关系建模。通过提供多样化的数据集配置,研究人员能够深入探讨不同时间尺度下的预测性能,并开发出更具鲁棒性的预测算法。这些研究不仅推动了时间序列预测领域的发展,还为实际应用中的决策支持提供了理论依据。
衍生相关工作
基于Chronos数据集,许多经典的研究工作得以展开。例如,研究人员开发了基于深度学习的多变量时间序列预测模型,显著提升了预测精度;此外,一些工作还探索了如何将外部因素(如天气、节假日等)纳入预测模型,以进一步提高预测的鲁棒性。这些衍生工作不仅丰富了时间序列预测的理论体系,还为实际应用提供了更多可行的解决方案。
以上内容由遇见数据集搜集并总结生成



