PSML
收藏arXiv2022-05-23 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.5130612
下载链接
链接失效反馈官方服务:
资源简介:
PSML数据集是由德克萨斯A&M大学和南加州大学的研究团队开发的首个开放访问的多尺度时间序列数据集,旨在支持未来电力系统可靠运行的数据驱动机器学习方法的发展。该数据集通过联合输电和配电电网合成,捕捉电网动态中日益重要的交互和不确定性,包含多个时空尺度的电力、电压和电流测量。PSML数据集包含分钟级实时负载、天气和可再生能源时间序列数据,覆盖美国66个区域,适用于开发多尺度机器学习算法,同时支持安全关键系统的启发式机器学习研究,并为能源部门的脱碳做出贡献。
The PSML dataset is the first open-access multi-scale time series dataset developed by research teams from Texas A&M University and the University of Southern California, which aims to support the development of data-driven machine learning methods for reliable operation of future power systems. Synthesized by integrating transmission and distribution grids, this dataset captures the increasingly important interactions and uncertainties in power grid dynamics, and includes power, voltage, and current measurements across multiple spatiotemporal scales. The PSML dataset includes minute-level real-time load, weather, and renewable energy time series data, covering 66 regions across the United States. It is suitable for developing multi-scale machine learning algorithms, supports heuristic machine learning research for safety-critical systems, and contributes to decarbonization efforts in the energy sector.
提供机构:
德克萨斯A&M大学
创建时间:
2021-10-13
搜集汇总
数据集介绍

构建方式
在电力系统迈向碳中和的背景下,PSML数据集通过创新的联合输配电网协同仿真平台构建而成。该平台整合了PSS/E 23节点输电系统与IEEE 13节点配电系统,实现了跨时空尺度的动态交互模拟。数据生成过程始于采集美国66个区域2018至2020年的真实负荷与气象数据,并基于物理模型合成可再生能源发电曲线。通过稳态潮流计算与暂态动态仿真,生成了涵盖分钟级与毫秒级的多尺度同步相量测量数据,包括电压、电流与功率时序序列,完整捕获了高比例可再生能源接入下的电网复杂动态特性。
特点
PSML数据集的核心特征在于其多尺度时空覆盖与高保真物理约束。数据集囊括了分钟级负荷、可再生能源与气象数据,以及分钟级与毫秒级的同步相量测量,时间分辨率跨越三个数量级。其独特之处在于通过输配电网联合仿真,精确建模了可再生能源深度渗透下的动态交互,弥补了传统仿真数据在跨层级耦合效应上的缺失。数据集中包含了超过1000种扰动事件,如短路、设备跳闸与强迫振荡等,为机器学习算法提供了丰富的动态模式样本。此外,数据集严格遵循电路物理定律,确保了合成数据的物理一致性与真实性。
使用方法
PSML数据集适用于三大关键机器学习任务:动态扰动事件的早期检测、分类与定位;负荷与可再生能源的鲁棒分层预测;以及物理定律约束下的合成时序数据生成。用户可通过Zenodo平台获取结构化数据文件,包括按区域组织的CSV格式负荷/可再生能源数据、按场景分类的同步相量测量数据。数据加载与预处理可借助提供的PyTorch数据加载器实现。研究者可基于数据集内置的基准代码,对比传统电力系统算法与前沿机器学习模型(如卷积神经网络、图神经网络、生成对抗网络等)的性能。数据集特别支持跨时空依赖建模的算法开发,为高比例可再生能源电网的可靠运行提供数据驱动的解决方案。
背景与挑战
背景概述
在应对气候变化的全球背景下,电力系统作为实现碳中和目标的关键基础设施,正经历着可再生能源渗透率不断加深的重大转型。由德克萨斯农工大学和南加州大学的研究团队于2022年联合创建的PSML数据集,是首个面向未来脱碳电网的多尺度时间序列开源数据集。该数据集旨在解决高比例可再生能源并网带来的强不确定性与动态交互问题,通过联合输配电网协同仿真,生成了涵盖分钟级至毫秒级的多时空尺度功率、电压与电流测量数据。PSML不仅为开发数据驱动的机器学习方法以保障电网可靠运行提供了关键资源,更通过提供动态扰动检测与定位、负荷与可再生能源分层预测、以及物理定律约束的测量数据合成三大基准任务,架起了电力系统与机器学习研究社区之间的桥梁,对推动能源领域的人工智能交叉研究具有开创性意义。
当前挑战
PSML数据集致力于应对高比例可再生能源并网环境下电网可靠运行的三大核心挑战:动态扰动的早期检测、精准分类与定位;负荷及可再生能源的鲁棒分层预测;以及符合物理定律的合成同步相量数据生成。在数据集构建过程中,研究团队面临多重技术挑战:首先,真实电网运行数据因涉及关键能源基础设施信息而严格保密,公开获取极其困难;其次,为捕捉深度可再生能源渗透下的未来电网动态,需构建全新的输配电网联合仿真平台,并集成太阳能光伏逆变器等详细动态模型,仿真复杂度高;再者,生成的数据需跨越分钟级稳态与毫秒级暂态等多时间尺度,并保持时空一致性,对数据生成方法与保真度验证提出了严峻考验。这些挑战使得PSML的创建成为一项融合了电力系统高保真建模与大规模数据合成的复杂系统工程。
常用场景
经典使用场景
在电力系统向深度可再生能源渗透转型的背景下,PSML数据集为机器学习算法提供了多时空尺度的时间序列基准测试平台。其最经典的应用场景在于支持动态扰动事件的早期检测、精准分类与定位研究。该数据集通过联合输配电网协同仿真,生成了涵盖毫秒级同步相量测量数据的丰富扰动案例,使得研究者能够开发并验证基于数据驱动的异常监测模型,从而应对高比例可再生能源接入带来的运行不确定性挑战。
衍生相关工作
围绕PSML数据集已衍生出多项经典研究工作,主要集中在三大方向:一是基于卷积神经网络(如InceptionTime、MC-DCNN)和时序对比学习的事件分类与定位算法,显著提升了动态扰动的识别精度;二是结合记忆网络与跨区域学习的负荷预测框架,致力于解决长时序依赖与空间关联性建模难题;三是针对物理约束的时序生成模型探索,如TimeGAN与COT-GAN在合成符合基尔霍夫定律的同步相量数据方面的尝试。这些工作推动了图神经网络、元学习等先进方法在电力系统场景中的迁移与创新。
数据集最近研究
最新研究方向
在能源系统迈向碳中和的背景下,PSML数据集为机器学习在电力系统中的应用开辟了多尺度时间序列分析的新前沿。该数据集通过整合输配电联合仿真,生成了涵盖分钟级至毫秒级的电压、电流与功率测量数据,为动态扰动检测、负荷与可再生能源预测以及合成数据生成三大核心任务提供了基准测试平台。当前研究聚焦于利用图神经网络捕捉电网空间拓扑依赖,以提升事件定位的准确性;同时探索记忆网络与跨序列学习机制,以应对长时程预测中周期性模式的提取挑战。在合成数据生成方面,研究者正致力于开发能够遵循基尔霍夫定律等物理约束的生成模型,以克服现有方法在保持数据多样性与真实性方面的局限。这些方向不仅推动了机器学习算法在安全关键系统中的创新,也为高比例可再生能源接入下的电网可靠运行提供了数据驱动的解决方案。
相关研究论文
- 1A Multi-scale Time-series Dataset with Benchmark for Machine Learning in Decarbonized Energy Grids德克萨斯A&M大学 · 2022年
以上内容由遇见数据集搜集并总结生成



