five

pmuBAGE

收藏
arXiv2022-10-26 更新2024-06-21 收录
下载链接:
https://github.com/pmuBAGE/pmuBAGE
下载链接
链接失效反馈
官方服务:
资源简介:
pmuBAGE是由IEEE成员Brandon Foggo、Koji Yamashita和Nanpeng Yu创建的电力系统事件数据集,包含近1000个标记的事件数据实例,旨在促进PMU数据分析的基准评估。该数据集是通过训练名为pmuGE的生成模型,基于大量真实事件数据生成的,能够创建高度真实的事件数据,同时保护训练数据的隐私。pmuBAGE适用于电力系统事件检测、分类和缺失值替换等应用,旨在解决电力系统动态研究中数据获取困难的问题。

pmuBAGE is a power system event dataset developed by IEEE members Brandon Foggo, Koji Yamashita, and Nanpeng Yu. It contains nearly 1,000 labeled event data instances, with the goal of facilitating benchmark evaluations for PMU data analysis. This dataset is generated by training a generative model named pmuGE on a large corpus of real-world event data, enabling the creation of highly realistic event data while safeguarding the privacy of the original training dataset. pmuBAGE supports applications including power system event detection, classification, and missing value imputation, and is intended to resolve the challenge of limited data access in power system dynamic research.
提供机构:
IEEE
创建时间:
2022-10-26
搜集汇总
数据集介绍
main_image_url
构建方式
在电力系统动态研究领域,获取真实的相量测量单元(PMU)事件数据长期面临挑战。pmuBAGE数据集的构建采用了创新的数据驱动生成模型pmuGE,该模型基于事件参与分解方法,将PMU数据分解为静态统计成分与动态物理成分,并进一步区分事件间与事件内特征。通过对美国大电网两年间收集的千余个真实事件进行训练,结合先进的概率编程方法与深度级联卷积生成模型,生成了近千个标注事件实例。这一过程不仅确保了生成数据的高度真实性,还通过差分隐私技术保护了训练所用PMU的敏感信息,使得数据集在保持事件动态特性的同时避免了隐私泄露风险。
使用方法
pmuBAGE数据集旨在为电力系统数据分析研究提供标准化的基准平台。研究人员可将其广泛应用于事件检测、分类及缺失值填补等机器学习任务的训练与验证。数据集以在线形式公开,用户可通过GitHub仓库直接获取,每个事件实例包含20秒时长的PQVF(有功功率、无功功率、电压幅值、频率)数据,采样率为30Hz,并以每单位值进行标准化处理。使用时可依据事件标签进行任务定制,例如利用不同成因的事件数据训练分类模型,或评估异常检测算法在合成事件上的泛化能力。该数据集的高可访问性与同质性有助于促进不同研究之间的公平比较,加速电力系统数据驱动方法的创新与发展。
背景与挑战
背景概述
在电力系统动态分析领域,相量测量单元(PMU)数据对于事件检测与分类研究具有关键价值,然而真实事件数据的获取长期面临壁垒。pmuBAGE数据集由加州大学河滨分校的Brandon Foggo、Koji Yamashita和Nanpeng Yu等人于2022年创建,旨在通过数据驱动的生成模型解决PMU事件数据稀缺问题。该数据集基于两年间从美国主干电网采集的千余次真实事件训练而成,包含近千个标注事件实例,覆盖电压与频率扰动等多种事件类型。其核心创新在于提出了事件参与分解方法,结合生成对抗网络技术,在保护数据隐私的前提下生成高保真合成事件数据,为电力系统机器学习算法提供了首个可公开访问的基准测试平台,显著推动了数据驱动方法在电网动态分析中的发展。
当前挑战
pmuBAGE数据集致力于应对电力系统事件分析与机器学习模型评估中的双重挑战。在领域问题层面,传统PMU事件数据因隐私与安全限制难以公开获取,阻碍了算法比较与复现研究;同时,真实数据中存在噪声复杂、事件类型不均衡、时空动态模式多样等问题,对事件检测与分类模型的鲁棒性提出更高要求。在构建过程中,研究团队需克服多源异构PMU数据的质量缺陷,如频繁缺失值与时间戳偏差,并通过事件参与分解技术分离动态特征与静态统计分量,以平衡数据真实性与隐私保护。此外,生成模型训练需解决高维时间序列的模态耦合难题,并确保合成数据在统计分布与物理动态层面均与真实事件保持一致,避免过拟合或模式坍塌。
常用场景
经典使用场景
在电力系统动态分析领域,pmuBAGE数据集作为首个基于真实同步相量数据驱动的生成式基准数据集,其经典使用场景聚焦于为机器学习算法提供标准化评估平台。该数据集通过事件参与分解技术,生成了近千个标注的电压与频率事件实例,覆盖了雷击、线路跳闸、风力波动及设备故障等多种事件类型,为研究人员提供了高度逼真且隐私安全的合成数据,从而支持事件检测、分类与缺失值填补等任务的基准测试与模型验证。
解决学术问题
pmuBAGE数据集有效解决了电力系统研究中真实同步相量数据获取困难、数据隐私受限以及评估标准不统一的学术难题。通过生成式对抗网络与事件签名建模,该数据集在保持数据真实性的同时,避免了原始测量数据的敏感信息泄露,为数据驱动的动态事件分析提供了可重复、可比较的基准环境。其意义在于加速了机器学习方法在电力系统异常检测与诊断中的发展,推动了跨研究团队成果的公平评估与迭代优化。
实际应用
在实际工程应用中,pmuBAGE数据集被广泛用于电力系统监控与安全防护工具的开发和测试。例如,电网运营商可利用该数据集训练和验证实时事件检测算法,提升对频率跌落、电压暂降等突发异常的响应速度与准确性。同时,数据集支持对可再生能源并网等新型场景的模拟,帮助工程师评估高渗透率分布式电源下的系统稳定性,为智能电网的态势感知与决策支持系统提供可靠的数据基础。
数据集最近研究
最新研究方向
在电力系统动态监测领域,同步相量测量单元(PMU)数据的稀缺性长期制约着数据驱动方法的发展。pmuBAGE数据集的推出,标志着生成式人工智能在合成PMU事件数据方面取得了突破性进展。该数据集基于事件参与分解框架,结合深度级联卷积生成模型,构建了涵盖近千个标记事件的基准集合,为算法评估提供了高度逼真且隐私安全的仿真环境。当前前沿研究聚焦于利用该数据集推动事件检测、分类及缺失值填补等任务的性能基准测试,同时促进生成模型在可再生能源集成、闪电击穿等复杂场景下的适应性优化。这一进展不仅加速了机器学习技术在电力系统分析中的部署,也为跨区域数据共享与协作研究建立了标准化范例。
相关研究论文
  • 1
    pmuBAGE: The Benchmarking Assortment of Generated PMU Data for Power System Events -- Part I: Overview and Results加州大学河滨分校电气与计算机工程系 · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作