PGLearn-ExtraLarge-Midwest24k
收藏Hugging Face2025-05-14 更新2025-05-15 收录
下载链接:
https://huggingface.co/datasets/PGLearn/PGLearn-ExtraLarge-Midwest24k
下载链接
链接失效反馈官方服务:
资源简介:
PGLearn最优潮流(Midwest24k)数据集是一个关于电力系统最优潮流问题的数据集。它包含了电力系统中的输入功率、发电机状态、线路状态等特征,以及最优潮流计算的原始和对偶变量结果。数据集适用于进行电力系统的最优潮流分析和研究。
PGLearn Optimal Power Flow (Midwest24k) Dataset is a dataset targeting optimal power flow problems in power systems. It encompasses features such as input power, generator status and line status in power systems, as well as the raw and dual variable results derived from optimal power flow calculations. This dataset is applicable for optimal power flow analysis and research in the field of power systems.
创建时间:
2025-05-14
原始信息汇总
PGLearn Optimal Power Flow (Midwest24k) 数据集概述
基本信息
- 许可证: CC-BY-SA-4.0
- 标签: 能源、优化、最优潮流、电网
- 数据集名称: PGLearn Optimal Power Flow (Midwest24k)
- 任务类别: 表格回归
数据集配置
- 配置名称: Midwest24k
- 默认配置: 是
数据特征
输入特征
input/pd: 浮点序列,长度11731input/qd: 浮点序列,长度11731input/gen_status: 布尔序列,长度5646input/branch_status: 布尔序列,长度33739input/seed: 整型
DCOPF相关特征
- 原始解:
DCOPF/primal/va: 浮点序列,长度23643DCOPF/primal/pg: 浮点序列,长度5646DCOPF/primal/pf: 浮点序列,长度33739
- 对偶解:
DCOPF/dual/kcl_p: 浮点序列,长度23643DCOPF/dual/pg: 浮点序列,长度5646DCOPF/dual/ohm_pf: 浮点序列,长度33739DCOPF/dual/pf: 浮点序列,长度33739DCOPF/dual/va_diff: 浮点序列,长度33739DCOPF/dual/slack_bus: 浮点型
- 元数据:
DCOPF/meta/seed: 整型DCOPF/meta/formulation: 字符串DCOPF/meta/primal_objective_value: 浮点型DCOPF/meta/dual_objective_value: 浮点型DCOPF/meta/primal_status: 字符串DCOPF/meta/dual_status: 字符串DCOPF/meta/termination_status: 字符串DCOPF/meta/build_time: 浮点型DCOPF/meta/extract_time: 浮点型DCOPF/meta/solve_time: 浮点型
SOCOPF相关特征
- 原始解:
SOCOPF/primal/w: 浮点序列,长度23643SOCOPF/primal/pg: 浮点序列,长度5646SOCOPF/primal/qg: 浮点序列,长度5646SOCOPF/primal/pf: 浮点序列,长度33739SOCOPF/primal/pt: 浮点序列,长度33739SOCOPF/primal/qf: 浮点序列,长度33739SOCOPF/primal/qt: 浮点序列,长度33739SOCOPF/primal/wr: 浮点序列,长度33739SOCOPF/primal/wi: 浮点序列,长度33739
- 对偶解:
SOCOPF/dual/kcl_p: 浮点序列,长度23643SOCOPF/dual/kcl_q: 浮点序列,长度23643SOCOPF/dual/w: 浮点序列,长度23643SOCOPF/dual/pg: 浮点序列,长度5646SOCOPF/dual/qg: 浮点序列,长度5646SOCOPF/dual/ohm_pf: 浮点序列,长度33739SOCOPF/dual/ohm_pt: 浮点序列,长度33739SOCOPF/dual/ohm_qf: 浮点序列,长度33739SOCOPF/dual/ohm_qt: 浮点序列,长度33739SOCOPF/dual/jabr: 二维数组,形状[33739, 4]SOCOPF/dual/sm_fr: 二维数组,形状[33739, 3]SOCOPF/dual/sm_to: 二维数组,形状[33739, 3]SOCOPF/dual/va_diff: 浮点序列,长度33739SOCOPF/dual/wr: 浮点序列,长度33739SOCOPF/dual/wi: 浮点序列,长度33739SOCOPF/dual/pf: 浮点序列,长度33739SOCOPF/dual/pt: 浮点序列,长度33739SOCOPF/dual/qf: 浮点序列,长度33739SOCOPF/dual/qt: 浮点序列,长度33739
- 元数据:
SOCOPF/meta/seed: 整型SOCOPF/meta/formulation: 字符串SOCOPF/meta/primal_objective_value: 浮点型SOCOPF/meta/dual_objective_value: 浮点型SOCOPF/meta/primal_status: 字符串SOCOPF/meta/dual_status: 字符串SOCOPF/meta/termination_status: 字符串SOCOPF/meta/build_time: 浮点型SOCOPF/meta/extract_time: 浮点型SOCOPF/meta/solve_time: 浮点型
数据集分割
- 分割名称: data
- 字节数: 262735979655
- 样本数: 52699
下载与存储信息
- 下载大小: 251886455051
- 数据集大小: 262735979655
搜集汇总
数据集介绍

构建方式
PGLearn-ExtraLarge-Midwest24k数据集聚焦于电力系统最优潮流计算领域,其构建过程基于大规模电力网络仿真。该数据集通过精确建模美国中西部电网拓扑结构,采用直流最优潮流(DCOPF)和二阶层锥最优潮流(SOCOPF)两种数学优化方法生成样本。数据采集过程包含完整的输入参数和输出结果,涵盖11731个节点有功需求、5646台发电机状态等电网特征,并通过严格的质量控制确保数据可靠性。
特点
作为当前电力系统优化领域最具规模的开放数据集,其核心价值体现在多维度的建模深度。数据集不仅包含传统的有功功率变量,还完整记录了电压相角、无功功率等关键参数,以及原始对偶问题的求解状态和计算耗时。特别值得注意的是,该数据集创新性地保留了二阶锥松弛的完整对偶变量,为研究电网安全约束优化提供了前所未有的数据支持。每个样本都附有详尽的元数据,包括求解器状态和目标函数值,构成电力系统优化研究的完整闭环。
使用方法
该数据集主要服务于电力系统优化算法的开发与验证,研究人员可通过HuggingFace平台直接加载标准化格式的数据。典型应用场景包括:使用DCOPF数据训练神经网络预测潮流分布,或利用SOCOPF对偶变量研究约束违反情况。数据采用分块存储设计,支持流式读取大规模样本,各字段均带有明确的物理量纲说明。建议使用者结合电网拓扑信息进行特征工程,并注意区分训练集与测试集的时间序列特性。
背景与挑战
背景概述
PGLearn-ExtraLarge-Midwest24k数据集聚焦于电力系统最优潮流(Optimal Power Flow, OPF)领域,由专业研究团队构建,旨在为电力网络优化问题提供大规模、高质量的基准数据。该数据集以美国中西部电网为原型,包含超过5万组仿真案例,覆盖直流最优潮流(DCOPF)和交流最优潮流(SOCOPF)两类核心模型,其多维特征矩阵完整记录了节点电压、发电机出力、支路功率等关键物理量,以及对应的对偶变量和求解过程元数据。作为能源优化领域的重要基础设施,该数据集为机器学习与传统电力系统分析的交叉研究提供了标准化评估平台,显著推动了智能电网优化算法的可解释性和鲁棒性研究。
当前挑战
电力系统最优潮流问题因其非凸非线性特性,传统数学规划方法常面临收敛性和计算效率的双重挑战。该数据集构建过程中需精确平衡物理约束的完整性与数值计算的稳定性,特别是处理交流模型时,需克服二阶锥松弛(SOCP)带来的高维稀疏矩阵求解难题。数据采集阶段涉及超2.3万个节点和3.3万条支路的拓扑结构,其规模创下领域纪录,导致仿真耗时与存储成本呈指数级增长。在应用层面,如何从海量异构数据中提取有效的物理规律特征,以及解决机器学习模型在安全约束条件下的泛化能力,仍是当前研究的核心瓶颈。
常用场景
经典使用场景
在电力系统优化领域,PGLearn-ExtraLarge-Midwest24k数据集被广泛用于最优潮流(OPF)问题的建模与求解。该数据集通过模拟美国中西部电网的实际运行状态,提供了包括节点功率注入、发电机状态、支路状态等在内的多维特征,为研究人员提供了一个接近真实场景的测试平台。经典使用场景包括基于线性规划(DCOPF)和非线性规划(SOCOPF)的最优潮流算法验证,以及电网运行效率的量化评估。
解决学术问题
该数据集有效解决了电力系统优化中的多个关键学术问题,包括大规模电网的高效求解、多目标优化中的权衡分析以及不确定性条件下的鲁棒性评估。通过提供详尽的原始数据和求解结果,研究人员能够深入分析不同优化算法的收敛性、计算效率以及解的质量,从而推动最优潮流理论的发展。其意义在于为电力系统优化领域提供了一个标准化、可复现的研究基准,显著提升了学术研究的透明度和可比性。
衍生相关工作
围绕该数据集,学术界衍生了一系列经典研究工作,包括基于深度学习的OPF求解器设计、分布式优化算法的开发以及鲁棒最优潮流模型的构建。这些工作不仅扩展了数据集的应用范围,还推动了电力系统优化与机器学习、高性能计算等领域的交叉融合。部分研究进一步将数据集扩展至动态OPF和随机OPF问题,为电网的实时优化和不确定性管理提供了新的解决方案。
以上内容由遇见数据集搜集并总结生成



