five

OPFData

收藏
arXiv2024-06-11 更新2024-06-17 收录
下载链接:
https://console.cloud.google.com/storage/browser/gridopt-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
OPFData是由Google DeepMind创建的大型数据集,专注于交流最优电力流(AC-OPF)问题,旨在解决电力系统的高效和安全运行问题。该数据集包含30万个已解决的AC-OPF问题,覆盖了从14到13659个总线的多个电网规模,是目前公开可用的最大此类数据集。数据集的创建过程涉及对广泛使用的PGLib-OPF库中的基础测试案例进行选择和变异处理,以模拟电网拓扑的变化。OPFData的应用领域广泛,包括但不限于电力系统的优化调度、可再生能源集成和电网安全分析,旨在通过机器学习方法提高电力系统的运行效率和可靠性。

OPFData is a large-scale dataset developed by Google DeepMind, focusing on the Alternating Current Optimal Power Flow (AC-OPF) problem, aiming to address the efficient and secure operation of power systems. This dataset contains 300,000 solved AC-OPF cases, covering multiple grid scales ranging from 14 to 13659 buses, and it is currently the largest publicly available dataset of its kind. The creation of OPFData involves selecting and mutating baseline test cases from the widely used PGLib-OPF library to simulate changes in power grid topologies. OPFData has a wide range of application scenarios, including but not limited to optimal scheduling of power systems, renewable energy integration, and power grid security analysis, with the goal of improving the operational efficiency and reliability of power systems through machine learning methods.
提供机构:
Google DeepMind
创建时间:
2024-06-11
搜集汇总
数据集介绍
main_image_url
构建方式
OPFData数据集的构建基于广泛的PGLib-OPF库中的基准测试案例,并采用了Julia语言结合PowerModels.jl库以及Ipopt和MUMPS求解器来解决AC-OPF问题。数据集由300k个已解决的AC-OPF问题组成,涵盖了从14到13659个节点的多种电网规模。每个问题都是一个独立的OPF问题,具有解决方案,允许在不同的例子之间灵活地表示不同的电网结构和属性。数据集分为两种类型:FullTop和N-1,分别对应于固定电网和可变电网。
特点
OPFData数据集具有以下特点:1)规模大:是目前公开可用的最大的已解决AC-OPF问题数据集,涵盖了多种电网规模;2)包含拓扑变化:数据集中包含拓扑变化,这是实际电网操作中的关键要求;3)格式通用:数据集以JSON格式分发,适合常见的机器学习工作流程;4)独立同分布:数据集是独立同分布的,且按顺序取自。
使用方法
OPFData数据集的使用方法如下:1)下载:从公共Google Cloud bucket (gs://gridopt-dataset/) 下载JSON格式的数据集;2)解析:使用适当的JSON解析库读取和解析数据集;3)预处理:根据具体的研究需求进行数据预处理,如特征选择、缩放等;4)训练:使用机器学习模型在数据集上进行训练,以解决AC-OPF问题;5)评估:使用验证集和测试集评估模型的性能,并进行必要的调优。
背景与挑战
背景概述
交流最优潮流问题(AC-OPF)的解决对于电力系统的规划与运行至关重要。小规模的效率提升在这一领域具有巨大的潜力,可带来数十亿美元的成本节约和化石燃料发电的显著减排。近年来,基于数据驱动的AC-OPF解决方案方法显示出相较于传统求解器的大幅速度提升潜力;然而,目前尚无大规模的开放数据集可供使用。本文介绍了迄今为止最大的已解决AC-OPF问题集合,其规模比现有数据集大几个数量级,能够训练高容量的数据驱动模型。独特之处在于,它包括了拓扑扰动,这是实际电力系统操作中的关键要求。我们希望这一资源能够激发社区对更大电网规模的研究,并具有可变拓扑。
当前挑战
AC-OPF问题的解决面临着诸多挑战。首先,该问题在一般形式下是一个非线性、非凸、混合整数约束优化问题,典型的求解方法要么计算成本过高,要么缺乏足够的鲁棒性,无法在大电网上进行实时应用。其次,高比例的可再生能源发电预计将增加这些问题的难度,因为它会导致电网惯性降低,并更多地依赖不确定的间歇性发电,以及增加电网拥堵,需要平衡行动。此外,基于机器学习的OPF解决方案在应用于实际电力系统操作时,必须可靠且鲁棒。常见的问题是相对于原始问题公式的约束不可行。这可以通过后处理模型输出或直接在学习过程中解决。另一个基本要求是对于电网拓扑变化的鲁棒性,无论是由于计划添加或移除电网组件、网络拓扑切换,还是由于计划外停电。图模型自然适合这一要求,因为它们的结构反映了数据的关系结构。尽管该领域引起了人们的兴趣,但可用的标准化数据集却很少。因此,研究人员通常需要自己生成数据集,这可能会涉及到对大型电网的大量计算时间投入。另一个挑战是缺乏标准化数据集和基准测试平台。
常用场景
经典使用场景
OPFData数据集广泛应用于解决交流最优潮流问题(AC-OPF),该问题对于电力系统的规划和运行至关重要。数据集的规模之大,为训练高容量数据驱动模型提供了可能性,从而实现比传统求解器更快的速度提升。数据集的独特之处在于,它包含了拓扑变化,这对于在现实电力系统操作中的使用至关重要。
解决学术问题
OPFData数据集解决了现有数据集在规模和多样性方面的不足。它不仅提供了大规模的AC-OPF问题解决方案,而且还包含了拓扑变化,这使得数据集能够适应现实世界中的电网变化。此外,数据集的公开可用性也为研究人员提供了标准化的测试平台,促进了该领域的标准化研究和比较。
衍生相关工作
OPFData数据集的发布,促进了相关研究的深入发展。基于该数据集,研究人员可以探索更高效的可行空间探索方法,例如更复杂的负载扰动分布或更彻底的约束集探索方案。此外,数据集也为进一步研究非拓扑扰动和输出特性提供了可能,例如,通过扰动发电容量、线路属性或发电成本来推广到不同的燃料类型,或使用OPF解决方案的活性约束集作为分类模型的输入,或使用对偶解来学习输出局部边际价格的模型。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作