five

autogluon/chronos_datasets_extra

收藏
Hugging Face2024-07-23 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/autogluon/chronos_datasets_extra
下载链接
链接失效反馈
官方服务:
资源简介:
Chronos数据集(额外部分)包含用于训练和评估Chronos预测模型的时间序列数据集。这些数据集包括ETTh、ETTm、巴西城市温度和西班牙能源与天气四个配置,每个配置都详细列出了特征、数据类型和数据集大小。数据集可以通过HuggingFace的datasets库加载,并且每个数据集可能有不同的开源许可证。

Chronos数据集(额外部分)包含用于训练和评估Chronos预测模型的时间序列数据集。这些数据集包括ETTh、ETTm、巴西城市温度和西班牙能源与天气四个配置,每个配置都详细列出了特征、数据类型和数据集大小。数据集可以通过HuggingFace的datasets库加载,并且每个数据集可能有不同的开源许可证。
提供机构:
autogluon
原始信息汇总

Chronos datasets (extra)

概述

  • 名称: Chronos datasets (extra)
  • 任务类别: 时间序列预测
  • 任务ID:
    • 单变量时间序列预测
    • 多变量时间序列预测
  • 许可证: Apache 2.0

数据集配置

ETTh

  • 特征:
    • id: 字符串
    • timestamp: 时间戳 (纳秒)
    • HUFL: 浮点数
    • HULL: 浮点数
    • MUFL: 浮点数
    • MULL: 浮点数
    • LUFL: 浮点数
    • LULL: 浮点数
    • OT: 浮点数
  • 分割:
    • train:
      • 字节数: 2,229,840
      • 样本数: 2
  • 下载大小: 0
  • 数据集大小: 2,229,840

ETTm

  • 特征:
    • id: 字符串
    • timestamp: 时间戳 (毫秒)
    • HUFL: 浮点数
    • HULL: 浮点数
    • MUFL: 浮点数
    • MULL: 浮点数
    • LUFL: 浮点数
    • LULL: 浮点数
    • OT: 浮点数
  • 分割:
    • train:
      • 字节数: 8,919,120
      • 样本数: 2
  • 下载大小: 0
  • 数据集大小: 8,919,120

brazilian_cities_temperature

  • 特征:
    • id: 字符串
    • timestamp: 时间戳 (毫秒)
    • temperature: 浮点数
  • 分割:
    • train:
      • 字节数: 109,234
      • 样本数: 12
  • 下载大小: 0
  • 数据集大小: 109,234

spanish_energy_and_weather

  • 特征:
    • timestamp: 时间戳 (毫秒)
    • generation_biomass: 浮点数
    • generation_fossil_brown_coal/lignite: 浮点数
    • generation_fossil_gas: 浮点数
    • generation_fossil_hard_coal: 浮点数
    • generation_fossil_oil: 浮点数
    • generation_hydro_pumped_storage_consumption: 浮点数
    • generation_hydro_run-of-river_and_poundage: 浮点数
    • generation_hydro_water_reservoir: 浮点数
    • generation_nuclear: 浮点数
    • generation_other: 浮点数
    • generation_other_renewable: 浮点数
    • generation_solar: 浮点数
    • generation_waste: 浮点数
    • generation_wind_onshore: 浮点数
    • total_load_actual: 浮点数
    • price_actual: 浮点数
    • Barcelona_temp: 浮点数
    • Bilbao_temp: 浮点数
    • Madrid_temp: 浮点数
    • Seville_temp: 浮点数
    • Valencia_temp: 浮点数
    • Barcelona_temp_min: 浮点数
    • Bilbao_temp_min: 浮点数
    • Madrid_temp_min: 浮点数
    • Seville_temp_min: 浮点数
    • Valencia_temp_min: 浮点数
    • Barcelona_temp_max: 浮点数
    • Bilbao_temp_max: 浮点数
    • Madrid_temp_max: 浮点数
    • Seville_temp_max: 浮点数
    • Valencia_temp_max: 浮点数
    • Barcelona_pressure: 浮点数
    • Bilbao_pressure: 浮点数
    • Madrid_pressure: 浮点数
    • Seville_pressure: 浮点数
    • Valencia_pressure: 浮点数
    • Barcelona_humidity: 浮点数
    • Bilbao_humidity: 浮点数
    • Madrid_humidity: 浮点数
    • Seville_humidity: 浮点数
    • Valencia_humidity: 浮点数
    • Barcelona_wind_speed: 浮点数
    • Bilbao_wind_speed: 浮点数
    • Madrid_wind_speed: 浮点数
    • Seville_wind_speed: 浮点数
    • Valencia_wind_speed: 浮点数
    • Barcelona_wind_deg: 浮点数
    • Bilbao_wind_deg: 浮点数
    • Madrid_wind_deg: 浮点数
    • Seville_wind_deg: 浮点数
    • Valencia_wind_deg: 浮点数
    • Barcelona_rain_1h: 浮点数
    • Bilbao_rain_1h: 浮点数
    • Madrid_rain_1h: 浮点数
    • Seville_rain_1h: 浮点数
    • Valencia_rain_1h: 浮点数
    • Barcelona_snow_3h: 浮点数
    • Bilbao_snow_3h: 浮点数
    • Madrid_snow_3h: 浮点数
    • Seville_snow_3h: 浮点数
    • Valencia_snow_3h: 浮点数
    • Barcelona_clouds_all: 浮点数
    • Bilbao_clouds_all: 浮点数
    • Madrid_clouds_all: 浮点数
    • Seville_clouds_all: 浮点数
    • Valencia_clouds_all: 浮点数
  • 分割:
    • train:
      • 字节数: 18,794,572
      • 样本数: 1
  • 下载大小: 0
  • 数据集大小: 18,794,572
搜集汇总
数据集介绍
main_image_url
构建方式
Chronos datasets (extra)的构建采取定制化脚本的方式,无法在主Chronos数据集仓库中托管的数据集由此仓库的脚本负责构造。这些数据集主要针对时间序列预测任务,包含单变量和多变量时间序列的预测,构建时考虑了数据的时序特性和多样性,以满足不同的训练和评估需求。
特点
该数据集的特点在于其涵盖了不同领域的时间序列数据,如能源消耗、气象变化等,且数据格式统一,便于模型的训练和比较。各数据集在遵循相应的开源协议下提供,保证了数据的使用自由度。此外,数据集的构建脚本遵循Apache 2.0协议,促进了学术和商业研究的共享与协作。
使用方法
使用Chronos datasets (extra)数据集时,用户可借助HuggingFace的datasets库进行加载。通过指定数据集名称、配置名称以及数据分割方式,用户可以方便地获取所需的数据。数据加载后,用户可将其格式设置为numpy数组,以利于后续的数据处理和分析操作。具体使用方法请参照官方文档和示例代码。
背景与挑战
背景概述
Chronos datasets(extra)是由亚马逊科学研究团队创建的时间序列数据集,旨在为Chronos预测模型提供训练和评估的基础。该数据集包含了不同配置的时间序列数据,如ETTh、ETTm、brazilian_cities_temperature以及spanish_energy_and_weather等,涵盖了从2012年至2018年的各种时间序列信息,包括温度、湿度、风速、气压、降雨量等天气因素,以及能源产量和价格等数据。这些数据集的构建,为时间序列预测领域的研究提供了宝贵的资源,对于推动相关技术的发展具有显著影响。
当前挑战
在构建Chronos datasets(extra)的过程中,研究人员面临了多方面的挑战。首先,数据集的多样性和复杂性要求在保证数据质量的同时,还需兼顾数据处理的效率。其次,由于数据集包含了大量的时间序列信息,如何有效地进行数据存储和访问成为一个关键问题。此外,不同数据集之间的数据格式和许可协议的差异性,为数据集的整合和使用增加了难度。在研究领域中,如何利用这些数据进行准确的时间序列预测,并解决实际问题,如能源需求预测和天气状况分析等,仍然是一个持续的挑战。
常用场景
经典使用场景
在时间序列预测的学术研究中,autogluon/chronos_datasets_extra数据集被广泛用于训练和评估预测模型。该数据集包含多种配置,如ETTh和ETTm,这些配置提供了具有时间戳和多种时间序列特征的样本,可用于单变量和多变量时间序列预测任务,是研究时间序列分析的经典数据源。
实际应用
在实际应用中,autogluon/chronos_datasets_extra数据集可用于能源消耗预测、金融市场趋势分析、气象预报等领域。通过对这些数据集的分析,可以辅助决策者进行更准确的未来趋势预测,优化资源分配,提高经济效益。
衍生相关工作
基于该数据集,已经衍生出了一系列相关的工作,包括改进的时间序列预测算法、特征工程方法以及模型评估技术。这些工作不仅推动了时间序列分析领域的研究进展,还为实际应用提供了强有力的技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作