DORAA-UY
收藏arXiv2025-05-30 更新2025-06-03 收录
下载链接:
https://github.com/tomyvazquez/DORAA-UY
下载链接
链接失效反馈官方服务:
资源简介:
DORAA-UY数据集是一个包含乌拉圭电力系统结构特征和近两年实际运行数据的公开数据集。数据集包括电气网络元素(母线、负载等)、其关键参数和互连,以及从2021年1月1日到2023年12月31日的每小时发电数据,以及从2021年3月21日到2023年10月17日的每10分钟消耗功率数据。该数据集旨在促进对基于学习的优化技术在电力系统管理中的研究。
提供机构:
乌拉圭共和国大学工程学院, 宾夕法尼亚大学电气与系统工程学院, 乌拉圭国家电力公司 (UTE)
创建时间:
2025-05-30
原始信息汇总
DORAA-UY 数据集概述
数据集基本信息
- 名称: DORAA-UY - Optimal Reactive Power Dispatch using Machine Learning
- 开发机构: 乌拉圭共和国大学工程学院 (Facultad de Ingeniería, UdelaR)
- 主要开发者: Ignacio Boero, Santiago Díaz, Tomás Vázquez
- 发布日期: 2024年
- 许可证: MIT License
- 数据集下载地址: https://drive.google.com/drive/folders/121s67_IgW-r39hG-xwHIUI32-_QIE97X?usp=sharing
- 文档地址: Documentacion.pdf
研究背景与目标
- 研究领域: 电力系统优化
- 核心问题: 最优无功功率调度 (Optimal Reactive Power Dispatch, ORPD)
- 技术方法:
- 监督学习与无监督学习
- 全连接神经网络 (FCNN)
- 图神经网络 (GNN)
- 应用场景: 乌拉圭电网优化
数据集内容
1. 电网模型
- IEEE测试电网:
- IEEE30 (30个母线)
- IEEE118 (118个母线)
- 乌拉圭实际电网:
- 107个母线 (95个150kV, 12个500kV)
- 144条线路
- 12台变压器
- 43台发电机
- 55个负载
- 6个无功补偿器
2. 数据来源
- IEEE电网数据: 合成数据生成
- 乌拉圭电网数据:
- 真实历史数据 (2021年1月起,每小时记录)
- 由乌拉圭国家负荷调度中心 (DNC) 提供
- 无功功率数据通过合成方法生成
技术实现
1. 优化问题建模
- 目标函数: 最小化电网损耗
- 约束条件:
- 功率流方程
- 母线电压限制
- 线路/变压器电流限制
- 发电机无功功率容量限制
2. 神经网络架构
- FCNN:
- 线性层序列
- Leaky ReLU激活函数
- 批归一化层
- GNN:
- 图卷积层
- 利用电网拓扑结构
3. 训练策略
- 监督学习: MSE损失函数
- 无监督学习: 优化问题的拉格朗日变体
数据生成与使用
1. 数据生成
-
IEEE电网: bash python generar_datos.py --red 30 --N 1000
-
乌拉圭电网: bash python generar_datos_sintetica.py --N 1000
2. 模型训练
- 配置文件位于
configs/目录 - 训练命令: bash train.py --cfg <path-to-config.yaml>
引用格式
bibtex @misc{GNN4OPFuru2024, author = {Boero, Ignacio and Diaz, Santiago and Vazquez, Tomas}, title = {DORAA-UY}, year = {2024}, version = {1.0.0}, url = {https://github.com/tomyvazquez/DORAA-UY}, note = {GitHub repository}, }
搜集汇总
数据集介绍

构建方式
DORAA-UY数据集的构建基于乌拉圭国家电力系统的实际运营数据,涵盖了从2021年1月至2023年12月的电力需求和发电数据,时间分辨率分别为10分钟和小时级别。数据集不仅包含电网的结构特性(如母线、负载、发电机和补偿器的电气参数),还整合了近两年的实时运行数据。通过PandaPower库对每个时间戳的输入数据进行最优无功功率调度(ORPD)求解,生成对应的输出数据。这一过程确保了数据集在时间和空间维度上的完整性和一致性。
特点
DORAA-UY数据集的特点在于其真实性和复杂性。与传统的基于IEEE标准系统的合成数据不同,该数据集反映了乌拉圭电网在高比例可再生能源接入下的实际运行状态。数据集中的发电和需求数据表现出明显的非均匀分布和季节性模式,例如太阳能发电的昼夜差异和水力发电的季节性波动。此外,数据集中还包含了电网拓扑结构和多类型发电机的详细参数,为研究实际电网条件下的优化问题提供了丰富的信息。
使用方法
DORAA-UY数据集可用于训练和评估机器学习模型在最优无功功率调度(ORPD)问题中的性能。研究人员可以通过加载数据集中的电网结构数据和实时运行数据,构建输入特征矩阵(如节点需求、发电功率等),并利用PandaPower生成的优化解作为标签。数据集支持监督学习和无监督学习方法,特别适合用于验证模型在真实电网条件下的泛化能力。此外,数据集的时间序列特性使其适用于研究季节性变化对电力系统优化的影响。
背景与挑战
背景概述
DORAA-UY数据集由乌拉圭共和国大学(Universidad de la República)与美国宾夕法尼亚大学(University of Pennsylvania)等机构的研究团队于2025年联合发布,旨在解决电力系统中最优无功功率调度(ORPD)这一核心问题。该数据集不仅包含乌拉圭全国电网的拓扑结构参数,还整合了2021至2023年间实际运行的发电与负荷数据,时间分辨率达10分钟级。作为首个公开的含高比例可再生能源(97%渗透率)的真实电网数据集,其通过记录风电、光伏等间歇性能源的动态特性,为传统基于IEEE标准算例的研究提供了关键的现实对照基准,推动了学习优化(Learning to Optimize)范式在电力系统非凸优化问题中的应用。
当前挑战
该数据集面临双重挑战:在领域问题层面,高比例可再生能源导致电网输入变量呈现强非均匀分布和复杂时空相关性(如图1所示风电与水电的异质统计特性),使得传统基于均匀采样合成数据训练的模型(如GNN)在实际场景中预测误差激增10倍;在构建层面,需解决多源异构数据(SCADA系统、气象记录、设备参数)的时空对齐问题,并处理IPOPT求解器对部分真实工况的收敛失败(约25%案例),这要求对原始数据进行严格的物理约束校验与缺失值修复。季节性波动与极端天气事件进一步加剧了数据分布的复杂性,暴露出当前学习架构对现实电网动态的建模局限性。
常用场景
经典使用场景
DORAA-UY数据集在电力系统优化领域具有重要应用价值,尤其在最优无功功率调度(ORPD)问题的研究中表现突出。该数据集包含了乌拉圭全国电网的结构特征以及近两年的实际运行数据,如负荷需求和发电功率。研究人员可以利用这些数据训练机器学习模型,以快速预测电网中的最优无功功率分配方案,从而替代传统耗时的优化算法。数据集的高质量实际数据为验证学习优化方法的有效性提供了可靠基础。
实际应用
在实际应用层面,DORAA-UY数据集为电力系统运营商提供了重要参考。数据集包含的乌拉圭电网信息可以帮助运营商更好地理解高比例可再生能源电网的运行特性。基于该数据集训练的优化模型可以用于实时电网调度,提高系统运行效率,降低功率损耗,并维持电压稳定性。此外,数据集还可用于电力系统规划研究,评估不同可再生能源渗透率对电网运行的影响。
衍生相关工作
DORAA-UY数据集已经衍生出多项重要研究工作。基于该数据集,研究人员比较了全连接神经网络(FCNN)和图神经网络(GNN)在解决ORPD问题上的性能差异。数据集还启发了对约束增强技术的研究,以解决学习优化方法在实际应用中出现的约束违反问题。此外,该数据集为后续研究真实电网中学习优化方法的泛化能力提供了基准,推动了电力系统机器学习领域的进一步发展。
以上内容由遇见数据集搜集并总结生成



