five

Sisyphean Power & Light — Synthetic Utility Dataset

收藏
github2026-02-16 更新2026-02-17 收录
下载链接:
https://github.com/SGridworks/Dynamic-Network-Model
下载链接
链接失效反馈
官方服务:
资源简介:
该仓库包含一个完整的合成数据集,模拟了虚构的中型电力公司Sisyphean Power & Light(SP&L),服务于亚利桑那州凤凰城地区约140,500名客户。数据集包括客户记录、网络拓扑、负载曲线、分布式能源安装和地理坐标等,全部为计算生成,仅供教育和实验用途。

This repository contains a comprehensive synthetic dataset that simulates the fictional mid-sized electric utility Sisyphean Power & Light (SP&L), which serves approximately 140,500 customers in the Phoenix, Arizona metropolitan area. The dataset includes customer records, network topologies, load profiles, distributed energy installations, geographic coordinates and other relevant data, all computationally generated solely for educational and experimental purposes.
创建时间:
2026-02-07
原始信息汇总

数据集概述

数据集名称

Dynamic Network Model (Sisyphean Power & Light — Synthetic Utility Dataset)

数据集简介

这是一个用于配电系统压力测试的轻量级模型,包含一个完整的虚构中型电力公司(Sisyphean Power & Light, SP&L)的合成数据集。该数据集模拟了美国亚利桑那州凤凰城地区一个服务约140,500名客户的虚构电力公司。

数据性质与用途

  • 数据性质:完全由计算生成的合成数据。不包含任何真实的客户、基础设施或运营数据。仅供教育和实验用途。
  • 核心目的:为电力工程师提供一个实验沙箱,用于将机器学习、人工智能工具和现代数据科学技术应用于配电系统。数据集专为与Claude Code等AI助手工具配合使用而设计。
  • 主要优势:提供了一个现实、互联的数据集,使用户可以立即开始查询、建模和构建,无需等待生产系统的脱敏数据、处理数据共享协议或使用无法反映现实复杂性的简单示例。

数据集内容与规模

数据集包含以下核心数据文件(位于demo_data/目录下):

  • substations.csv: 15个变电站数据
  • feeders.csv: 65条馈线数据
  • transformers.csv: 21,545台变压器数据
  • customers.csv: 140,459个客户数据
  • load_profiles.csv.gz: 174,720条十五分钟负荷记录
  • customer_interval_data.csv.gz: 336,000条高级计量架构(AMI)间隔数据记录
  • solar_installations.csv: 17,242个太阳能光伏系统数据
  • solar_profiles.csv: 288条发电曲线数据
  • ev_chargers.csv: 11,076个电动汽车充电器数据
  • ev_charging_profiles.csv: 48条充电负荷曲线数据
  • battery_installations.csv: 4,180个电池储能系统数据
  • weather_data.csv: 43,848条小时级天气记录(5年)
  • growth_scenarios.csv: 85个场景预测数据
  • outage_history.csv: 2,306条停电事件记录(2020-2024年)
  • network_nodes.csv: 43,827个地理信息系统(GIS)点要素数据
  • network_edges.csv: 43,826个地理信息系统(GIS)折线要素数据

数据集结构

该仓库包含两个主要数据集版本:

  1. V1.0数据集 (demo_data/): 原始数据集,包含上述所有CSV文件。
  2. V2.0数据集 (sisyphean-power-and-light/): 为机器学习应用重构的数据集,包含以下目录:
    • assets/: 变压器和开关设备数据
    • generation/: 锅炉给水泵(BFP)训练数据集(发电站)
    • network/: OpenDSS潮流模型
    • outages/: 扩展的停电和调度记录
    • scenarios/: JSON场景配置文件
    • timeseries/: Parquet格式的负荷和AMI数据
    • weather/: 扩展的天气观测数据

典型应用场景

利用此数据集可以构建以下模型或工具:

  • 负荷预测模型(具有天气相关性的跨季节十五分钟负荷曲线)
  • 承载能力分析(馈线和变压器上的太阳能/电动汽车饱和度)
  • 可靠性分析(基于天气、设备寿命和负荷的停电预测)
  • 网络优化(基于GIS节点/边拓扑和开关操作的图分析)
  • 场景规划工具(针对5种增长预测对电网进行压力测试)
  • 地理空间仪表板(与凤凰城街道网格对齐的坐标,可立即映射)
  • 数字孪生原型(完整的变电站到电表层级模型)
  • 潮流近似计算(包含阻抗、导线规格和相位数据)
  • 高级计量架构(AMI)分析(具有真实负荷形状的十五分钟客户间隔数据)

快速开始

  1. 克隆仓库:git clone https://github.com/SGridworks/Dynamic-Network-Model.git
  2. 进入目录:cd Dynamic-Network-Model
  3. 安装依赖:pip install -r requirements.txt
  4. 启动Jupyter Lab:jupyter lab
  5. 打开快速入门笔记本 notebooks/00-getting-started.ipynb 或使用Python加载数据: python from demo_data.load_demo_data import load_all data = load_all()

许可证

该合成数据集遵循MIT许可证,仅供教育和实验使用。Sisyphean Power & Light是一个虚构实体。

搜集汇总
数据集介绍
构建方式
在电力系统仿真领域,合成数据集为研究人员提供了安全且可控的实验环境。Sisyphean Power & Light数据集采用计算生成方法构建,以虚构的亚利桑那州凤凰城地区中型电力公司为蓝本,模拟了约14.05万用户的服务网络。其构建过程基于确定性算法,通过设定固定随机种子确保数据可复现性,涵盖了从变电站到电表的完整层级结构,包括网络拓扑、负荷曲线、分布式能源安装及气象记录等多维度数据,形成了一个高度逼真且内部关联的电力系统模型。
特点
该数据集的核心特点在于其综合性与真实性。它不仅包含了详尽的电网基础设施数据,如节点、边线、变压器和馈线,还提供了精细的时间序列信息,例如15分钟间隔的负荷曲线和高级计量基础设施记录。数据集融入了多种现实场景要素,包括电动汽车充电桩、太阳能光伏系统、电池储能装置以及五年期的气象数据,支持对热浪、风暴等极端天气事件的可靠性分析。其结构化设计便于进行地理空间映射、图网络分析及数字孪生原型开发,为机器学习模型训练提供了丰富的特征维度。
使用方法
使用该数据集时,用户可通过克隆GitHub仓库并安装依赖环境快速启动。数据加载接口设计简洁,支持一键导入所有核心数据表,包括馈线、客户、网络节点和高级计量基础设施记录等。配套的Jupyter笔记本提供了从入门到高级分析的完整指南,涵盖负荷预测、承载能力评估、停电预测及网络优化等多种应用场景。数据集兼容OpenDSS等电力系统仿真工具,并包含版本适配器,方便用户在V1与V2数据结构间无缝转换,为电力工程师构建AI驱动工具提供了即用型实验平台。
背景与挑战
背景概述
随着全球能源转型的加速推进,电力系统正面临分布式能源高比例渗透、电动汽车规模化接入以及极端气候事件频发等多重挑战,对配电网的规划、运行与韧性提出了更高要求。在此背景下,Sisyphean Power & Light — Synthetic Utility Dataset应运而生,该数据集由SGridworks团队于近年创建,旨在为电力工程师和研究人员提供一个高度逼真、结构完整的合成配电网数据平台。其核心研究问题聚焦于模拟中型电力公司的运营场景,支持机器学习与人工智能技术在负荷预测、承载能力分析、可靠性评估及网络优化等领域的应用验证,有效填补了真实数据获取困难、隐私限制严格的科研空白,推动了智能电网数据分析方法的发展与创新。
当前挑战
该数据集致力于解决配电网领域在新型电力系统背景下所面临的复杂挑战,例如高精度负荷预测需应对可再生能源与电动汽车负载的强随机性,网络优化需处理大规模节点拓扑的实时计算复杂度,而可靠性分析则需整合气象、设备老化等多源异构数据以准确预测故障。在构建过程中,挑战主要体现在如何通过合成数据生成技术,在确保数据真实性与逻辑一致性的前提下,模拟出涵盖客户、变压器、分布式能源及地理信息系统的全要素交互关系,同时避免泄露真实用户隐私,并保持数据在时间序列、空间关联及物理约束上的内在有效性,从而为高级分析模型提供可靠的基础。
常用场景
经典使用场景
在电力系统研究领域,Sisyphean Power & Light合成数据集为学者和工程师提供了一个高度仿真的沙盒环境,用于探索分布式电网的复杂动态。该数据集最经典的使用场景在于支持负荷预测模型的开发与验证,其包含的15分钟间隔负荷曲线与气象数据关联,能够模拟不同季节和天气条件下的电力需求变化。研究人员可以基于这些数据构建机器学习模型,分析电动汽车普及、太阳能增长等趋势对电网稳定性的影响,从而为电网规划提供数据驱动的决策支持。
实际应用
在实际应用层面,该数据集为电力公司和技术开发者提供了强大的场景规划工具。工程师可以利用其中的增长预测和极端天气情景,对电网进行压力测试,评估其在热浪、风暴等突发事件下的韧性。此外,数据集支持地理空间分析和托管容量计算,帮助规划人员优化太阳能和电动汽车充电设施的部署,提升电网运营效率并推动能源转型策略的落地实施。
衍生相关工作
围绕该数据集,已衍生出一系列经典研究工作,主要集中在电网数字孪生和高级分析领域。例如,基于其网络拓扑和负荷数据开发的OpenDSS电力流模型,为分布式系统仿真提供了标准框架;同时,结合天气与设备老化数据的停电预测模型,推动了可靠性分析的进步。这些工作不仅扩展了数据集的应用边界,也为电力系统机器学习研究建立了可复现的基准,促进了学术与工业界的协作创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作