five

tulipa762/electricity_load_diagrams

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/tulipa762/electricity_load_diagrams
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了2011年至2014年期间370个葡萄牙客户的每小时电力消耗时间序列数据。数据集主要用于时间序列预测任务,特别是短期电力负荷预测。数据集的结构包括训练集、验证集和测试集,并且提供了两种配置(uci和lstnet)。数据集的创建目的是为了研究和开发负荷预测方法。

This dataset contains hourly time-series electricity consumption data from 370 Portuguese customers spanning the period from 2011 to 2014. It is primarily intended for time series forecasting tasks, with a specific focus on short-term electricity load forecasting. The dataset is divided into training, validation, and test subsets, and offers two configurations: uci and lstnet. It was developed to support research and development of load forecasting methodologies.
提供机构:
tulipa762
原始信息汇总

数据集概述

  • 数据集名称: Electricity Load Diagrams
  • 数据集大小:
    • 下载大小: 261335609字节
    • 数据集大小: 388031993字节(配置uci),244032000字节(配置lstnet
  • 语言: 单语种(monolingual)
  • 许可证: 未知
  • 多语言性: 单语种
  • 任务类别: 时间序列预测
  • 任务ID: 单变量时间序列预测
  • 数据集来源: 原始数据
  • 数据集创建者: Artur Trindade

数据集结构

数据实例

  • 开始时间 (start): 时间戳,表示每个时间序列的起始时间。
  • 目标 (target): 浮点数序列,表示实际的目标值。
  • 静态特征类别 (feat_static_cat): 无符号整数序列,包含每个时间序列的分类标识符。
  • 项目ID (item_id): 字符串,用于标识数据集中的每个时间序列。

数据字段

  • start: 数据类型为timestamp[s],表示时间序列的开始时间。
  • target: 数据类型为float32,表示目标值的时间序列。
  • feat_static_cat: 数据类型为uint64,表示静态分类特征的时间序列。
  • item_id: 数据类型为string,表示时间序列的唯一标识符。

数据分割

  • 训练集 (train):
    • 配置uci: 370个样本,42968147字节
    • 配置lstnet: 320个样本,20843200字节
  • 测试集 (test):
    • 配置uci: 2590个样本,302059069字节
    • 配置lstnet: 2240个样本,195401080字节
  • 验证集 (validation):
    • 配置uci: 370个样本,43004777字节
    • 配置lstnet: 320个样本,27787720字节

数据集使用

  • 配置参数:
    • freq: 时间序列频率,默认值为"1H"
    • prediction_length: 预测范围,默认值为24
    • rolling_evaluations: 测试分割中的滚动窗口时间序列数量,默认值为7

数据集创建

  • 数据集来源: 覆盖葡萄牙370个子站的电力负荷,采样周期为15分钟,从2011年到2014年。
  • 数据集目的: 研究和开发负荷预测方法,特别是短期电力负荷预测。

数据集特征

  • 数据集无缺失值。
  • 原始值以每15分钟间隔的千瓦表示,并重新采样为每小时频率。
  • 每个时间序列代表一个客户。
  • 所有时间标签报告为葡萄牙时间,每天包含96个测量值(24*4)。
  • 每年3月的时间变化日(仅有23小时),1:00 am至2:00 am之间的值为零。
  • 每年10月的时间变化日(有25小时),1:00 am至2:00 am之间的值汇总了两小时的消耗。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过收集2011年至2014年间葡萄牙370个客户的每小时电力消耗数据构建而成。数据来源于原始的电力负荷图,经过重新采样以小时为频率进行标准化处理。数据集包括两个配置:'uci'和'lstnet',分别用于不同的训练和测试分割策略。'uci'配置基于时间序列的滚动窗口进行分割,而'lstnet'配置则采用固定比例分割法。
使用方法
使用该数据集时,用户可以通过指定频率(freq)和预测长度(prediction_length)来调整模型配置。例如,可以通过设置rolling_evaluations参数来定义测试集中的滚动窗口数量。数据集支持单变量时间序列预测任务,用户可以通过训练集、验证集和测试集来评估模型的预测性能。
背景与挑战
背景概述
电力负荷图数据集(Electricity Load Diagrams)由Artur Trindade开发并于2014年发布,主要用于研究短期电力负荷预测。该数据集包含了2011年至2014年间葡萄牙370个客户的每小时电力消耗时间序列数据,采样频率为15分钟,后被重新采样为每小时数据。此数据集的创建旨在推动负荷预测方法的研究与发展,特别是在短期电力预测领域,为相关领域的研究提供了宝贵的资源。
当前挑战
该数据集在构建过程中面临的主要挑战包括数据的时间序列特性处理,特别是在处理夏令时变化日(如3月和10月的时钟调整日)时,电力消耗数据的特殊处理。此外,数据集在应用中的挑战主要集中在时间序列预测任务上,如单变量时间序列预测,这要求模型能够准确捕捉长期和短期的电力消耗模式,以提高预测精度。
常用场景
经典使用场景
在电力负荷预测领域,tulipa762/electricity_load_diagrams数据集以其丰富的历史数据和精细的时间分辨率,成为研究者和工程师们进行时间序列预测的经典工具。该数据集包含了2011年至2014年间葡萄牙370个客户的每小时电力消耗数据,为模型训练和验证提供了坚实的基础。通过分析这些数据,研究者可以开发出能够准确预测未来电力需求的模型,从而优化电力资源的分配和调度。
解决学术问题
该数据集在学术研究中解决了时间序列预测中的多个关键问题,特别是在短期电力负荷预测方面。通过提供高频率和长时间跨度的电力消耗数据,研究者能够深入探讨如何捕捉和建模时间序列中的长期和短期模式。这不仅有助于提升预测模型的准确性,还为开发更复杂的深度学习模型提供了实验平台,推动了时间序列分析领域的发展。
实际应用
在实际应用中,tulipa762/electricity_load_diagrams数据集被广泛用于电力系统的优化和管理。电力公司利用这些数据来预测未来的电力需求,从而更有效地规划发电和输电资源,减少能源浪费和成本。此外,该数据集还可用于智能电网的开发,通过实时监控和预测电力消耗,提高电网的稳定性和效率,促进可再生能源的集成和利用。
数据集最近研究
最新研究方向
在电力负荷预测领域,tulipa762/electricity_load_diagrams数据集的最新研究方向主要集中在利用深度神经网络模型捕捉长期和短期的时间序列模式。该数据集提供了葡萄牙370个客户从2011年到2014年的每小时电力消耗数据,为研究者提供了一个丰富的实验平台。前沿研究不仅关注于提高预测精度,还探索了如何处理时间变化日等特殊情况对数据的影响。此外,研究者们也在尝试通过引入更多的外部变量,如天气数据和节假日信息,来进一步优化预测模型。这些研究不仅有助于提升电力系统的运行效率,还对能源管理和可持续发展具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作