five

GridSFM_US_power_grid

收藏
Hugging Face2026-05-08 更新2026-05-10 收录
下载链接:
https://huggingface.co/datasets/microsoft/GridSFM_US_power_grid
下载链接
链接失效反馈
官方服务:
资源简介:
GridSFM美国电网数据集是一个基于公开数据构建的地理位置明确、电气连贯的电力系统网络数据集,旨在支持交流最优潮流(AC-OPF)分析,用于研究拥堵、容量和需求分布等物理基础问题。数据集包含48个美国本土州和6个多州区域的54个OPF就绪的输电网络模型,每个模型包括总线-分支拓扑、估计的电气参数(线路阻抗、变压器特性)、发电机属性(容量、燃料类型、成本函数)、每小时需求分配、直流预热启动解决方案(电压角度和调度)以及用于AC-OPF可行性的合成无功补偿分流器。数据集适用于研究美国输电网络的物理基础问题,如输电扩展潜力、线路升级和大负荷安置等。数据集不适用于详细的操作或市场关键决策,如实时调度、应急分析或需要精确系统参数的监管规划。
提供机构:
Microsoft
创建时间:
2026-05-01
搜集汇总
数据集介绍
main_image_url
构建方式
GridSFM US Power Grid Dataset的构建完全依赖于公开数据源,涵盖了OpenStreetMap、美国能源信息署(EIA)、美国人口普查局及HIFLD等政府基础设施数据集。研究团队通过一个多阶段流水线,将异构地理空间与电力基础设施数据转化为适用于最优潮流分析的输电网模型,具体步骤包括数据提取、拓扑重建、电气参数估计、负荷分配以及渐进松弛法下的最优潮流求解。每个模型实例均以自包含的JSON格式呈现,兼容PowerModels.jl与MATPOWER工具生态,最终生成涵盖48个州及6个多州区域的54个分析实例。
特点
该数据集的核心特色在于其地理真实性与电气一致性,所有模型均基于实际地理坐标构建,并配备了完整的母线-支路拓扑、估计的线路阻抗与变压器参数、发电机属性(容量、燃料类型、成本函数)及逐时负荷分配方案。每个实例还提供直流潮流温启动解及合成无功补偿支路,以确保交流最优潮流分析的可行性。数据集按地理范围(州或多州区域)与运行工况(峰值16时或谷值04时)进行标注,覆盖从单一州到大陆尺度互联网络的广泛场景,规模达到百兆至千兆级别。
使用方法
用户可通过Hugging Face平台直接下载数据集,或使用GridSFM官方Python加载器高效访问。加载器支持按区域、运行时刻或文件类型灵活查询,并可自动将整个数据集导出至本地目录。每个模型文件以标准MATPOWER格式存储,可直接用于PowerModels.jl进行直流或交流最优潮流求解。建议用户根据研究目标,按地理区域或运行工况划分训练、验证与测试集,并注意该数据集专为学术研究设计,不适用于高可靠性运营或商业决策场景。
背景与挑战
背景概述
电力系统作为现代社会运转的基石,其运行优化与规划决策的精准性至关重要。然而,由于电网数据通常被电力运营商视为敏感商业信息并严格保密,学术界和工业界在开展大规模、可复现的物理模型研究时长期受困于数据匮乏。为破解这一瓶颈,微软研究院Catalyst Lab团队于2025至2026年间创建了GridSFM US Power Grid数据集,旨在为美国本土48个州及6个跨州区域提供完全基于公开数据的、具备地理真实性与电气一致性的输电网络模型。该数据集的核心研究问题聚焦于如何利用OpenStreetMap、美国能源信息署(EIA)及人口普查等公开异构数据,重构并生成可直接用于交流最优潮流(AC-OPF)分析的电网模型。数据集包含54个待求解的输电网实例,涵盖拓扑结构、估计电气参数、发电机属性及小时级负荷分配,为研究输电扩张、线路升级及大容量负荷选址等物理问题奠定了坚实基础,在电力系统开源数据与计算优化领域具有重要的开创性意义。
当前挑战
GridSFM US Power Grid数据集所面临的核心挑战在于,如何在严格依赖公开数据的前提下,跨越从地理信息碎片到精确电网物理模型之间的鸿沟,从而支撑交流最优潮流分析这一关键领域问题。具体挑战包括:其一,原始数据源(如OpenStreetMap)中的电力基础设施地理信息存在错位、缺失或拓扑不完整等问题,导致需开发复杂的多阶段流水线以完成拓扑重构、电气参数估计与负荷分配,这一过程引入了不可避免的估计噪声与近似误差,例如线路阻抗的热极限推断不精确、并联回路遗漏以及启发式负荷分配带来的偏差。其二,由于缺乏实测电气参数、保护配置、动态行为数据及时间序列运行约束,数据集无法捕获真实电网的细微运行特性,这严重限制了其在实时调度、紧急状态分析或监管规划等高保真度场景下的应用。此外,构建过程需要处理来自多个异构公开来源(EIA、人口普查局、HIFLD)的大规模时空数据,并在算法层面实现发电机与地理位置的自动匹配(如EIA工厂ID匹配),这进一步带来了数据清洗、去重以及匹配置信度评估(0至1分匹配评分)方面的技术与验证挑战,最终模型仅能保证物理可行性而非运行精确性,故而明确界定其用于研究探索而非安全关键决策。
常用场景
经典使用场景
GridSFM_US_power_grid数据集的核心经典用途在于为美国48个州的输电网络提供物理可解且地理真实的交流最优潮流(AC-OPF)分析基础。它汇聚了公开来源的输电拓扑、发电机参数及负荷数据,构建了一个可直接用于电力系统科研的标准化模型库。研究者可利用该数据集模拟电力系统的稳态行为,评估不同运行条件下的潮流分布、线路阻塞与电压水平,从而在不受数据访问限制的前提下开展物理机理驱动的探索。其设计尤其关注从单一州到多州互联的跨区域网络规模,确保模型能够支撑从局部到大陆尺度的电网仿真需求。
衍生相关工作
围绕GridSFM_US_power_grid数据集已衍生出一系列重要学术工作,其中最代表性的是其配套论文《Building Power Grid Models from Open Data: A Complete Pipeline from OpenStreetMap to Optimal Power Flow》,详细阐述了从原始公开数据到OPF就绪模型的完整构建流程。基于该数据集,研究者已开展关于多区域互联AC-OPF求解器性能评估、负荷分配方法对阻塞电价影响对比、以及随机规划在大规模输电系统中的可扩展性测试等工作。此外,数据集还被用于训练基于物理信息的神经网络代理模型,以加速电网风险分析。这些衍生研究共同证实了开源电网模型在推动可复现电力系统研究中的基础性作用,也为后续公开基准测试系统的开发树立了范式。
数据集最近研究
最新研究方向
GridSFM_US_power_grid数据集的出现,标志着电力系统领域首次实现从公开地理空间数据到交流最优潮流分析模型的端到端全自动构建,为学术界在缺乏受限制的电网专有数据条件下开展物理驱动的网络研究开辟了崭新路径。当前前沿研究聚焦于利用该数据集探讨跨州输电扩容潜力、关键线路针对性升级策略以及大型负荷接入的经济物理耦合分析,同时结合OpenStreetMap等众包数据源与美国EIA、人口普查等多源异构信息的融合,推动了参数自动估值与拓扑推断算法的进化。该数据集涵盖48个州及6个多州互联区域的54个实例,与近年来能源系统开放科学和可重复性研究的热潮紧密呼应,其MIT许可协议更降低了知识壁垒,对加速电网韧性评估、环保调度及可再生能源并网等重大议题的学术探索具有里程碑式意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作