five

autogluon/chronos_datasets

收藏
Hugging Face2025-03-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/autogluon/chronos_datasets
下载链接
链接失效反馈
官方服务:
资源简介:
Chronos数据集主要专注于时间序列预测任务。该数据集包含多种配置,如dominick、electricity_15min、ercot、exchange_rate、m4_daily、m4_hourly、m4_monthly、m4_quarterly、m4_weekly、m4_yearly、m5、mexico_city_bikes、monash_australian_electricity、monash_car_parts、monash_cif_2016、monash_covid_deaths、monash_electricity_hourly、monash_electricity_weekly、monash_fred_md、monash_hospital、monash_kdd_cup_2018、monash_london_smart_meters、monash_m1_monthly、monash_m1_quarterly、monash_m1_yearly、monash_m3_monthly、monash_m3_quarterly、monash_m3_yearly、monash_nn5_weekly、monash_pedestrian_counts、monash_rideshare、monash_saugeenday、monash_temperature_rain、monash_tourism_monthly、monash_tourism_quarterly、monash_tourism_yearly、monash_traffic、monash_weather、nn5、solar和solar_1h。每个配置都有特定的特征、数据分割、下载大小、数据集大小和主页。这些数据集用于单变量和多变量时间序列预测任务。

Chronos数据集主要专注于时间序列预测任务。该数据集包含多种配置,如dominick、electricity_15min、ercot、exchange_rate、m4_daily、m4_hourly、m4_monthly、m4_quarterly、m4_weekly、m4_yearly、m5、mexico_city_bikes、monash_australian_electricity、monash_car_parts、monash_cif_2016、monash_covid_deaths、monash_electricity_hourly、monash_electricity_weekly、monash_fred_md、monash_hospital、monash_kdd_cup_2018、monash_london_smart_meters、monash_m1_monthly、monash_m1_quarterly、monash_m1_yearly、monash_m3_monthly、monash_m3_quarterly、monash_m3_yearly、monash_nn5_weekly、monash_pedestrian_counts、monash_rideshare、monash_saugeenday、monash_temperature_rain、monash_tourism_monthly、monash_tourism_quarterly、monash_tourism_yearly、monash_traffic、monash_weather、nn5、solar和solar_1h。每个配置都有特定的特征、数据分割、下载大小、数据集大小和主页。这些数据集用于单变量和多变量时间序列预测任务。
提供机构:
autogluon
搜集汇总
数据集介绍
main_image_url
构建方式
在时间序列预测领域,构建高质量的数据集对于模型训练与评估至关重要。Chronos数据集通过整合多个公开来源的时间序列数据,形成了一套综合性的基准测试集合。其构建过程涉及从原始数据源(如UCI机器学习库、M竞赛数据集、Monash时间序列库等)进行数据提取与标准化处理,确保不同数据集在时间戳格式、序列长度和特征维度上具有一致性。数据集以配置(config)形式组织,每个配置对应一个特定的数据子集,涵盖了零售、能源、交通、气象等多个应用场景,为研究者提供了丰富的实验材料。
特点
Chronos数据集的特点体现在其多样性与广泛性上,涵盖了从高频到低频、从单变量到多变量的多种时间序列类型。数据集包含如M4竞赛的多个频率子集(如每日、每小时、每月等),以及来自现实世界的电力负荷、汇率、自行车共享等实际监测数据。每个数据子集均配有详细的特征描述,包括时间戳、目标变量及可能的分类标签或元数据,部分数据集还提供了地理位置、容量等辅助信息。这种结构化的特征设计使得数据集既能支持传统的单变量预测任务,也能适应复杂的多变量与时空预测需求。
使用方法
使用Chronos数据集时,研究者可通过HuggingFace数据集库直接加载特定配置,例如选择'm4_daily'或'electricity_15min'等子集进行实验。数据集通常仅包含训练分割,适用于时间序列预测中的模型训练与验证,用户需自行划分训练集与测试集以评估模型性能。加载后的数据以标准格式呈现,包括序列化的时间戳和目标变量,便于直接输入到预测框架(如AutoGluon Chronos)中进行建模。此外,数据集的元信息(如许可证、原始主页)提供了追溯来源与合规使用的依据,确保了研究的可重复性与透明度。
背景与挑战
背景概述
时间序列预测作为数据科学的核心分支,其发展历程始终与高质量基准数据集的构建紧密相连。Chronos数据集由AutoGluon团队整合并发布,旨在为单变量与多变量时间序列预测研究提供一套标准化、多样化的评估基准。该数据集汇集了来自多个知名竞赛与开源项目的时序数据,涵盖电力负荷、汇率波动、零售销售、交通流量及气象观测等广泛领域,其创建反映了学术界与工业界对统一预测基准的迫切需求。通过整合M4、M5竞赛数据及Monash时序预测库等权威来源,Chronos不仅促进了预测模型的横向比较,更推动了预测方法在复杂现实场景中的泛化能力研究,对提升预测算法的稳健性与实用性具有深远影响。
当前挑战
时间序列预测领域长期面临数据异质性、非平稳性及外部变量耦合等核心挑战,Chronos数据集所涵盖的多元场景恰好映射了这些难题。例如,电力负荷数据呈现强周期性与突发波动共存的特性,零售销售数据则需处理间歇性需求与促销事件的影响,这些均对模型的适应能力提出严峻考验。在数据集构建层面,挑战主要源于多源数据的整合与标准化。不同原始数据集在时间粒度、缺失值处理、元数据标注等方面存在显著差异,需进行细致的对齐与清洗工作。同时,确保数据在聚合过程中保留其统计特性与预测价值,并遵循各数据源的许可协议,构成了数据集构建中的关键难点。
常用场景
经典使用场景
在时间序列预测领域,Chronos数据集作为基准测试的基石,其经典使用场景聚焦于评估和比较各类预测模型的性能。该数据集整合了从零售销售、电力消耗到交通流量等多元领域的时序数据,为研究者提供了统一的实验平台。通过模拟真实世界中的预测任务,例如基于历史数据预测未来需求或趋势,它使得模型在跨领域、多频率的复杂场景下得以系统验证,从而推动预测算法的普适性与鲁棒性发展。
衍生相关工作
围绕Chronos数据集,学术界衍生了一系列经典研究工作,特别是在大规模时间序列预测模型的开发与评估方面。例如,基于其子集如M4和M5竞赛数据的研究催生了诸如Transformer-based预测架构、概率预测方法以及元学习框架等创新成果。这些工作不仅提升了预测精度,还推动了预测不确定性量化、多步预测策略等细分方向的发展,形成了从基准构建到算法突破的完整研究脉络,持续引领着时间序列分析领域的前沿探索。
数据集最近研究
最新研究方向
在时间序列预测领域,Chronos数据集作为集成多源异构数据的基准库,正推动着前沿研究向大规模预训练模型与零样本泛化能力的方向演进。该数据集涵盖电力负荷、交通流量、零售销售及气象观测等多元场景,为探索Transformer架构在长序列建模中的适应性提供了丰富素材。近期研究热点聚焦于如何利用其跨领域时序特征,构建统一的基础预测模型,以应对现实世界中数据稀疏与分布外泛化的挑战。这一趋势不仅加速了预测算法在能源管理、供应链优化等关键领域的落地应用,也深化了学术界对时序数据本质规律的理解,具有显著的实践与理论双重意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作