autogluon/chronos_datasets_extra

Name: autogluon/chronos_datasets_extra
Creator: autogluon
Published: 2024-07-23 12:53:07
License: 暂无描述

Hugging Face2024-07-23 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/autogluon/chronos_datasets_extra

下载链接

链接失效反馈

官方服务：

资源简介：

Chronos数据集（额外部分）包含用于训练和评估Chronos预测模型的时间序列数据集。这些数据集包括ETTh、ETTm、巴西城市温度和西班牙能源与天气四个配置，每个配置都详细列出了特征、数据类型和数据集大小。数据集可以通过HuggingFace的datasets库加载，并且每个数据集可能有不同的开源许可证。

提供机构：

autogluon

原始信息汇总

Chronos datasets (extra)

概述

名称: Chronos datasets (extra)
任务类别: 时间序列预测
任务ID:
- 单变量时间序列预测
- 多变量时间序列预测
许可证: Apache 2.0

数据集配置

ETTh

特征:
- id: 字符串
- timestamp: 时间戳 (纳秒)
- HUFL: 浮点数
- HULL: 浮点数
- MUFL: 浮点数
- MULL: 浮点数
- LUFL: 浮点数
- LULL: 浮点数
- OT: 浮点数
分割:
- train:
  - 字节数: 2,229,840
  - 样本数: 2
下载大小: 0
数据集大小: 2,229,840

ETTm

特征:
- id: 字符串
- timestamp: 时间戳 (毫秒)
- HUFL: 浮点数
- HULL: 浮点数
- MUFL: 浮点数
- MULL: 浮点数
- LUFL: 浮点数
- LULL: 浮点数
- OT: 浮点数
分割:
- train:
  - 字节数: 8,919,120
  - 样本数: 2
下载大小: 0
数据集大小: 8,919,120

brazilian_cities_temperature

特征:
- id: 字符串
- timestamp: 时间戳 (毫秒)
- temperature: 浮点数
分割:
- train:
  - 字节数: 109,234
  - 样本数: 12
下载大小: 0
数据集大小: 109,234

spanish_energy_and_weather

特征:
- timestamp: 时间戳 (毫秒)
- generation_biomass: 浮点数
- generation_fossil_brown_coal/lignite: 浮点数
- generation_fossil_gas: 浮点数
- generation_fossil_hard_coal: 浮点数
- generation_fossil_oil: 浮点数
- generation_hydro_pumped_storage_consumption: 浮点数
- generation_hydro_run-of-river_and_poundage: 浮点数
- generation_hydro_water_reservoir: 浮点数
- generation_nuclear: 浮点数
- generation_other: 浮点数
- generation_other_renewable: 浮点数
- generation_solar: 浮点数
- generation_waste: 浮点数
- generation_wind_onshore: 浮点数
- total_load_actual: 浮点数
- price_actual: 浮点数
- Barcelona_temp: 浮点数
- Bilbao_temp: 浮点数
- Madrid_temp: 浮点数
- Seville_temp: 浮点数
- Valencia_temp: 浮点数
- Barcelona_temp_min: 浮点数
- Bilbao_temp_min: 浮点数
- Madrid_temp_min: 浮点数
- Seville_temp_min: 浮点数
- Valencia_temp_min: 浮点数
- Barcelona_temp_max: 浮点数
- Bilbao_temp_max: 浮点数
- Madrid_temp_max: 浮点数
- Seville_temp_max: 浮点数
- Valencia_temp_max: 浮点数
- Barcelona_pressure: 浮点数
- Bilbao_pressure: 浮点数
- Madrid_pressure: 浮点数
- Seville_pressure: 浮点数
- Valencia_pressure: 浮点数
- Barcelona_humidity: 浮点数
- Bilbao_humidity: 浮点数
- Madrid_humidity: 浮点数
- Seville_humidity: 浮点数
- Valencia_humidity: 浮点数
- Barcelona_wind_speed: 浮点数
- Bilbao_wind_speed: 浮点数
- Madrid_wind_speed: 浮点数
- Seville_wind_speed: 浮点数
- Valencia_wind_speed: 浮点数
- Barcelona_wind_deg: 浮点数
- Bilbao_wind_deg: 浮点数
- Madrid_wind_deg: 浮点数
- Seville_wind_deg: 浮点数
- Valencia_wind_deg: 浮点数
- Barcelona_rain_1h: 浮点数
- Bilbao_rain_1h: 浮点数
- Madrid_rain_1h: 浮点数
- Seville_rain_1h: 浮点数
- Valencia_rain_1h: 浮点数
- Barcelona_snow_3h: 浮点数
- Bilbao_snow_3h: 浮点数
- Madrid_snow_3h: 浮点数
- Seville_snow_3h: 浮点数
- Valencia_snow_3h: 浮点数
- Barcelona_clouds_all: 浮点数
- Bilbao_clouds_all: 浮点数
- Madrid_clouds_all: 浮点数
- Seville_clouds_all: 浮点数
- Valencia_clouds_all: 浮点数
分割:
- train:
  - 字节数: 18,794,572
  - 样本数: 1
下载大小: 0
数据集大小: 18,794,572

搜集汇总

数据集介绍

构建方式

Chronos datasets (extra)的构建采取定制化脚本的方式，无法在主Chronos数据集仓库中托管的数据集由此仓库的脚本负责构造。这些数据集主要针对时间序列预测任务，包含单变量和多变量时间序列的预测，构建时考虑了数据的时序特性和多样性，以满足不同的训练和评估需求。

特点

该数据集的特点在于其涵盖了不同领域的时间序列数据，如能源消耗、气象变化等，且数据格式统一，便于模型的训练和比较。各数据集在遵循相应的开源协议下提供，保证了数据的使用自由度。此外，数据集的构建脚本遵循Apache 2.0协议，促进了学术和商业研究的共享与协作。

使用方法

使用Chronos datasets (extra)数据集时，用户可借助HuggingFace的datasets库进行加载。通过指定数据集名称、配置名称以及数据分割方式，用户可以方便地获取所需的数据。数据加载后，用户可将其格式设置为numpy数组，以利于后续的数据处理和分析操作。具体使用方法请参照官方文档和示例代码。

背景与挑战

背景概述

Chronos datasets（extra）是由亚马逊科学研究团队创建的时间序列数据集，旨在为Chronos预测模型提供训练和评估的基础。该数据集包含了不同配置的时间序列数据，如ETTh、ETTm、brazilian_cities_temperature以及spanish_energy_and_weather等，涵盖了从2012年至2018年的各种时间序列信息，包括温度、湿度、风速、气压、降雨量等天气因素，以及能源产量和价格等数据。这些数据集的构建，为时间序列预测领域的研究提供了宝贵的资源，对于推动相关技术的发展具有显著影响。

当前挑战

在构建Chronos datasets（extra）的过程中，研究人员面临了多方面的挑战。首先，数据集的多样性和复杂性要求在保证数据质量的同时，还需兼顾数据处理的效率。其次，由于数据集包含了大量的时间序列信息，如何有效地进行数据存储和访问成为一个关键问题。此外，不同数据集之间的数据格式和许可协议的差异性，为数据集的整合和使用增加了难度。在研究领域中，如何利用这些数据进行准确的时间序列预测，并解决实际问题，如能源需求预测和天气状况分析等，仍然是一个持续的挑战。

常用场景

经典使用场景

在时间序列预测的学术研究中，autogluon/chronos_datasets_extra数据集被广泛用于训练和评估预测模型。该数据集包含多种配置，如ETTh和ETTm，这些配置提供了具有时间戳和多种时间序列特征的样本，可用于单变量和多变量时间序列预测任务，是研究时间序列分析的经典数据源。

实际应用

在实际应用中，autogluon/chronos_datasets_extra数据集可用于能源消耗预测、金融市场趋势分析、气象预报等领域。通过对这些数据集的分析，可以辅助决策者进行更准确的未来趋势预测，优化资源分配，提高经济效益。

衍生相关工作

基于该数据集，已经衍生出了一系列相关的工作，包括改进的时间序列预测算法、特征工程方法以及模型评估技术。这些工作不仅推动了时间序列分析领域的研究进展，还为实际应用提供了强有力的技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集