autogluon/chronos_datasets_extra
收藏Hugging Face2024-07-23 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/autogluon/chronos_datasets_extra
下载链接
链接失效反馈官方服务:
资源简介:
Chronos数据集(额外部分)包含用于训练和评估Chronos预测模型的时间序列数据集。这些数据集包括ETTh、ETTm、巴西城市温度和西班牙能源与天气四个配置,每个配置都详细列出了特征、数据类型和数据集大小。数据集可以通过HuggingFace的datasets库加载,并且每个数据集可能有不同的开源许可证。
Chronos数据集(额外部分)包含用于训练和评估Chronos预测模型的时间序列数据集。这些数据集包括ETTh、ETTm、巴西城市温度和西班牙能源与天气四个配置,每个配置都详细列出了特征、数据类型和数据集大小。数据集可以通过HuggingFace的datasets库加载,并且每个数据集可能有不同的开源许可证。
提供机构:
autogluon
原始信息汇总
Chronos datasets (extra)
概述
- 名称: Chronos datasets (extra)
- 任务类别: 时间序列预测
- 任务ID:
- 单变量时间序列预测
- 多变量时间序列预测
- 许可证: Apache 2.0
数据集配置
ETTh
- 特征:
id: 字符串timestamp: 时间戳 (纳秒)HUFL: 浮点数HULL: 浮点数MUFL: 浮点数MULL: 浮点数LUFL: 浮点数LULL: 浮点数OT: 浮点数
- 分割:
train:- 字节数: 2,229,840
- 样本数: 2
- 下载大小: 0
- 数据集大小: 2,229,840
ETTm
- 特征:
id: 字符串timestamp: 时间戳 (毫秒)HUFL: 浮点数HULL: 浮点数MUFL: 浮点数MULL: 浮点数LUFL: 浮点数LULL: 浮点数OT: 浮点数
- 分割:
train:- 字节数: 8,919,120
- 样本数: 2
- 下载大小: 0
- 数据集大小: 8,919,120
brazilian_cities_temperature
- 特征:
id: 字符串timestamp: 时间戳 (毫秒)temperature: 浮点数
- 分割:
train:- 字节数: 109,234
- 样本数: 12
- 下载大小: 0
- 数据集大小: 109,234
spanish_energy_and_weather
- 特征:
timestamp: 时间戳 (毫秒)generation_biomass: 浮点数generation_fossil_brown_coal/lignite: 浮点数generation_fossil_gas: 浮点数generation_fossil_hard_coal: 浮点数generation_fossil_oil: 浮点数generation_hydro_pumped_storage_consumption: 浮点数generation_hydro_run-of-river_and_poundage: 浮点数generation_hydro_water_reservoir: 浮点数generation_nuclear: 浮点数generation_other: 浮点数generation_other_renewable: 浮点数generation_solar: 浮点数generation_waste: 浮点数generation_wind_onshore: 浮点数total_load_actual: 浮点数price_actual: 浮点数Barcelona_temp: 浮点数Bilbao_temp: 浮点数Madrid_temp: 浮点数Seville_temp: 浮点数Valencia_temp: 浮点数Barcelona_temp_min: 浮点数Bilbao_temp_min: 浮点数Madrid_temp_min: 浮点数Seville_temp_min: 浮点数Valencia_temp_min: 浮点数Barcelona_temp_max: 浮点数Bilbao_temp_max: 浮点数Madrid_temp_max: 浮点数Seville_temp_max: 浮点数Valencia_temp_max: 浮点数Barcelona_pressure: 浮点数Bilbao_pressure: 浮点数Madrid_pressure: 浮点数Seville_pressure: 浮点数Valencia_pressure: 浮点数Barcelona_humidity: 浮点数Bilbao_humidity: 浮点数Madrid_humidity: 浮点数Seville_humidity: 浮点数Valencia_humidity: 浮点数Barcelona_wind_speed: 浮点数Bilbao_wind_speed: 浮点数Madrid_wind_speed: 浮点数Seville_wind_speed: 浮点数Valencia_wind_speed: 浮点数Barcelona_wind_deg: 浮点数Bilbao_wind_deg: 浮点数Madrid_wind_deg: 浮点数Seville_wind_deg: 浮点数Valencia_wind_deg: 浮点数Barcelona_rain_1h: 浮点数Bilbao_rain_1h: 浮点数Madrid_rain_1h: 浮点数Seville_rain_1h: 浮点数Valencia_rain_1h: 浮点数Barcelona_snow_3h: 浮点数Bilbao_snow_3h: 浮点数Madrid_snow_3h: 浮点数Seville_snow_3h: 浮点数Valencia_snow_3h: 浮点数Barcelona_clouds_all: 浮点数Bilbao_clouds_all: 浮点数Madrid_clouds_all: 浮点数Seville_clouds_all: 浮点数Valencia_clouds_all: 浮点数
- 分割:
train:- 字节数: 18,794,572
- 样本数: 1
- 下载大小: 0
- 数据集大小: 18,794,572
搜集汇总
数据集介绍

构建方式
Chronos datasets (extra)的构建采取定制化脚本的方式,无法在主Chronos数据集仓库中托管的数据集由此仓库的脚本负责构造。这些数据集主要针对时间序列预测任务,包含单变量和多变量时间序列的预测,构建时考虑了数据的时序特性和多样性,以满足不同的训练和评估需求。
特点
该数据集的特点在于其涵盖了不同领域的时间序列数据,如能源消耗、气象变化等,且数据格式统一,便于模型的训练和比较。各数据集在遵循相应的开源协议下提供,保证了数据的使用自由度。此外,数据集的构建脚本遵循Apache 2.0协议,促进了学术和商业研究的共享与协作。
使用方法
使用Chronos datasets (extra)数据集时,用户可借助HuggingFace的datasets库进行加载。通过指定数据集名称、配置名称以及数据分割方式,用户可以方便地获取所需的数据。数据加载后,用户可将其格式设置为numpy数组,以利于后续的数据处理和分析操作。具体使用方法请参照官方文档和示例代码。
背景与挑战
背景概述
Chronos datasets(extra)是由亚马逊科学研究团队创建的时间序列数据集,旨在为Chronos预测模型提供训练和评估的基础。该数据集包含了不同配置的时间序列数据,如ETTh、ETTm、brazilian_cities_temperature以及spanish_energy_and_weather等,涵盖了从2012年至2018年的各种时间序列信息,包括温度、湿度、风速、气压、降雨量等天气因素,以及能源产量和价格等数据。这些数据集的构建,为时间序列预测领域的研究提供了宝贵的资源,对于推动相关技术的发展具有显著影响。
当前挑战
在构建Chronos datasets(extra)的过程中,研究人员面临了多方面的挑战。首先,数据集的多样性和复杂性要求在保证数据质量的同时,还需兼顾数据处理的效率。其次,由于数据集包含了大量的时间序列信息,如何有效地进行数据存储和访问成为一个关键问题。此外,不同数据集之间的数据格式和许可协议的差异性,为数据集的整合和使用增加了难度。在研究领域中,如何利用这些数据进行准确的时间序列预测,并解决实际问题,如能源需求预测和天气状况分析等,仍然是一个持续的挑战。
常用场景
经典使用场景
在时间序列预测的学术研究中,autogluon/chronos_datasets_extra数据集被广泛用于训练和评估预测模型。该数据集包含多种配置,如ETTh和ETTm,这些配置提供了具有时间戳和多种时间序列特征的样本,可用于单变量和多变量时间序列预测任务,是研究时间序列分析的经典数据源。
实际应用
在实际应用中,autogluon/chronos_datasets_extra数据集可用于能源消耗预测、金融市场趋势分析、气象预报等领域。通过对这些数据集的分析,可以辅助决策者进行更准确的未来趋势预测,优化资源分配,提高经济效益。
衍生相关工作
基于该数据集,已经衍生出了一系列相关的工作,包括改进的时间序列预测算法、特征工程方法以及模型评估技术。这些工作不仅推动了时间序列分析领域的研究进展,还为实际应用提供了强有力的技术支持。
以上内容由遇见数据集搜集并总结生成



