five

ERCOT电网综合数据集|电力系统数据集|可再生能源数据集

收藏
arXiv2024-12-09 更新2024-12-11 收录
电力系统
可再生能源
下载链接:
https://github.com/alimenati/PowerMamba
下载链接
链接失效反馈
资源简介:
ERCOT电网综合数据集是由德克萨斯A&M大学和哈佛大学的研究团队创建的,旨在支持电力系统中的多元时间序列预测。该数据集包含五年内的负荷、电价、辅助服务价格和可再生能源发电数据,具有每小时的时间分辨率和区域级别的详细信息。数据集的创建过程结合了高分辨率的外部预测数据,以提高预测精度。该数据集主要应用于电力系统的预测和优化,旨在解决电网中由于可再生能源集成和需求变化带来的不确定性问题。
提供机构:
德克萨斯A&M大学,哈佛大学
创建时间:
2024-12-09
原始信息汇总

PowerMamba 数据集概述

数据集描述

  • 数据来源: 该数据集涵盖了德克萨斯电力可靠性委员会(ERCOT)电网的区域负荷、区域电价、辅助服务价格和可再生能源发电的时间序列数据,具有每小时的时间粒度。
  • 时间范围: 数据集跨越五年。
  • 空间分辨率: 提供区域级别的空间分辨率。
  • 数据通道: 包含22个核心时间序列,扩展版本包含262个通道,其中包括外部预测。

数据集内容

  • 核心时间序列: 22个时间序列,涵盖区域负荷、电价、辅助服务价格和可再生能源发电。
  • 扩展时间序列: 262个通道,包括外部预测。

数据集用途

  • 时间序列预测: 用于电力系统中的时间序列预测任务。
  • 模型性能评估: 用于评估PowerMamba模型与其他基准模型在时间序列预测任务中的性能。

数据集结构

  • data: 包含该项目使用的基准数据集。

数据集性能

  • 预测精度: PowerMamba模型在所有预测任务中均优于当前基准模型。
  • 计算效率: PowerMamba模型在参数数量上显著少于其他模型,同时提高了预测误差。
  • 上下文窗口大小: 随着上下文窗口大小的增加,模型性能持续提升。

数据集相关研究

引用

如果使用该数据集或相关研究,请引用以下内容:

@misc{menati2024powermamba, title={PowerMamba: A Deep State Space Model and Comprehensive Benchmark for Time Series Prediction in Electric Power Systems}, author={Ali Menati and Fatemeh Doudi and Dileep Kalathil and Le Xie}, year={2024}, eprint={2412.06112}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2412.06112}, }

AI搜集汇总
数据集介绍
main_image_url
构建方式
ERCOT电网综合数据集通过整合ERCOT电网的多个关键时间序列数据构建而成,涵盖了五年(2019-2023)的负荷、电价、辅助服务价格以及可再生能源发电数据,具有每小时的时间分辨率。该数据集不仅包括了8个区域的负荷和电价数据,还涵盖了4种辅助服务价格和风能、太阳能发电数据。此外,数据集还引入了ERCOT提供的负荷和可再生能源发电的外部预测数据,进一步增强了数据集的多样性和复杂性。
使用方法
ERCOT电网综合数据集可用于多种电力系统时间序列预测任务,包括负荷预测、电价预测、辅助服务价格预测以及可再生能源发电预测。研究者可以通过该数据集训练和验证多元时间序列预测模型,尤其是结合外部预测数据的模型。数据集的开放性使得研究者能够在一个统一的框架下进行模型基准测试,并探索不同模型在电力系统预测任务中的表现。
背景与挑战
背景概述
ERCOT电网综合数据集是由德克萨斯A&M大学和哈佛大学的研究人员创建的,旨在应对电力系统中由于可再生能源的广泛集成和需求电气化带来的不确定性。该数据集涵盖了ERCOT电网五年的负荷、电价、辅助服务价格和可再生能源发电数据,提供了每小时的时间分辨率和区域级别的详细信息。数据集的创建旨在支持复杂的多变量时间序列预测模型,以应对电力系统中日益复杂的动态变化。通过提供高分辨率的外部预测数据,该数据集为研究人员提供了一个统一的框架,用于评估和比较先进的机器学习模型在电力系统预测中的性能。
当前挑战
ERCOT电网综合数据集面临的挑战主要来自电力系统的高度复杂性和不确定性。首先,可再生能源的间歇性和不可预测性使得负荷和发电的预测变得极为困难。其次,电力市场价格信号与负荷和发电之间的相互作用增加了预测的复杂性。此外,现有数据集通常缺乏空间粒度,无法捕捉区域或节点间的差异,且时间跨度较短,限制了复杂模型的训练。构建该数据集时,研究人员还需解决如何有效整合高分辨率的外部预测数据,以在不增加模型复杂度的情况下提升预测精度。
常用场景
经典使用场景
ERCOT电网综合数据集的经典使用场景主要集中在电力系统的时间序列预测任务中。该数据集涵盖了五年内ERCOT电网的负荷、电价、辅助服务价格以及可再生能源发电等多维度数据,提供了高分辨率的时间序列信息。通过结合深度学习与传统状态空间模型,该数据集支持多变量时间序列的联合预测,能够有效捕捉负荷、发电与电价之间的复杂动态关系,为电力系统的可靠运行提供了关键支持。
解决学术问题
ERCOT电网综合数据集解决了电力系统中多变量时间序列预测的学术难题。传统模型通常分别预测负荷、发电或电价,忽略了它们之间的相互作用,导致预测精度下降。该数据集通过提供多维度的联合数据,支持多变量预测模型的开发,显著提升了预测精度。此外,数据集的高分辨率和长时间跨度为训练复杂的深度学习模型(如Transformer)提供了理想的基础,推动了电力系统时间序列预测领域的研究进展。
实际应用
ERCOT电网综合数据集在实际应用中具有广泛的应用前景。首先,它为电力系统的调度与规划提供了精确的负荷与发电预测,帮助电网运营商优化资源配置,提升系统可靠性。其次,通过预测电价与辅助服务价格,市场参与者能够更好地制定交易策略,降低市场风险。此外,数据集中的可再生能源发电数据为可再生能源的集成与管理提供了重要参考,支持电网向净零排放目标迈进。
数据集最近研究
最新研究方向
ERCOT电网综合数据集的最新研究方向主要集中在电力系统时间序列预测领域,特别是通过结合深度学习与传统状态空间模型(SSM)来捕捉多变量时间序列的动态特性。研究者们提出了名为PowerMamba的模型,该模型通过时间序列分解、多样化标记策略以及Mamba块的并行处理,有效捕捉局部和全局的时间依赖性。此外,研究还设计了一个时间序列处理模块,能够无缝集成高分辨率的外部预测数据,提升预测精度而不显著增加模型复杂度。ERCOT电网数据集的发布为电力系统预测提供了丰富的数据支持,涵盖了负荷、电价、辅助服务价格和可再生能源发电等多个维度,推动了电力系统预测模型的创新与优化。
相关研究论文
  • 1
    PowerMamba: A Deep State Space Model and Comprehensive Benchmark for Time Series Prediction in Electric Power Systems德克萨斯A&M大学,哈佛大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

LendingClub Loan Data

Loan & Rejects (2007 to 2019Q3)

kaggle 收录

TaRF

TaRF 是由密歇根大学、耶鲁大学和加州大学伯克利分校联合创建的视触融合场景数据集,旨在将视觉与触觉信号对齐至共享的三维空间。该数据集包含 19.3k 对齐的视觉与触觉样本,覆盖 13 个普通场景,如办公室、走廊和户外环境。数据采集通过结合神经辐射场(NeRF)和触觉传感器完成,利用多视图几何方法校准视觉与触觉信号,实现空间对齐。TaRF 的创建过程包括场景的多视角视觉重建和同步采集触觉信号,最终通过扩散模型生成未直接采样的触觉信号。该数据集可用于触觉信号估计、触觉定位和材料属性理解等任务,为机器人交互和虚拟世界构建提供重要支持。

github 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

jojogo9/freshness

该数据集包含图像及其对应的标签,标签分为6类:腐烂的橙子、腐烂的香蕉、腐烂的苹果、新鲜的橙子、新鲜的香蕉、新鲜的苹果。数据集分为训练集和测试集,训练集包含10908个样本,测试集包含2705个样本。数据文件存储在指定的路径下。

hugging_face 收录