digital-twin-dataset
收藏github2025-01-09 更新2025-01-10 收录
下载链接:
https://github.com/caltech-netlab/digital-twin-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从美国合作伙伴收集的数据,数据已匿名化处理以移除所有地理标识符。数据集包含三种时间序列数据以及电路拓扑数据,具体包括电流和电压的均方根值、同步相量测量和原始点波测量。
This dataset contains data collected from U.S. partners, and the data has been anonymized to remove all geographic identifiers. It includes three types of time-series data and circuit topology data, specifically the root-mean-square (RMS) values of electric current and voltage, synchronized phasor measurements, and raw point-on-wave measurements.
创建时间:
2025-01-04
原始信息汇总
数据集概述
数据集来源
该数据集包含从美国合作伙伴配电系统运营商收集的数据,数据已匿名化处理,删除了所有地理标识符。
数据集样本
- 下载地址: https://caltech.box.com/s/5baxy2ogbalqohpidh1lyxgnnxmv5tuc
- 内容: 样本数据集包含与完整数据集相同类型的数据,但覆盖的时间范围较小,适合初步实验。
- 存储位置: 下载后请将数据放置在
sample_dataset文件夹中。
完整数据集
- 访问方式: 提交申请表单 https://forms.office.com/r/Ds6rKEtyTV
- 预计可用时间: 2025年2月
- 数据格式: 与样本数据集相同
数据类型
数据集包含以下四种类型的数据:
1. 幅值数据 (sample_data/magnitude)
- 内容: 包含电流和电压的均方根幅值,不包含相位角信息。
- 采样间隔: 1秒
2. 同步相量数据 (sample_data/phasor)
- 内容: 包含同步相量测量数据,以复数形式表示。
- 采样间隔: 10秒
3. 同步波形数据 (sample_data/waveform)
- 内容: 包含原始点波测量数据,采样频率为2.5kHz。
- 波形长度: 约1秒
- 采样间隔: 每10秒一个波形,采样间隔约为400微秒
4. 网络和参数数据
- 内容: 包含时变电路拓扑和参数信息,如线路连接、变压器铭牌额定值和断路器状态。
- 物理资产网络: 模型化电路至单个组件,电力传输元素(如线路、变压器、开关)为图的边,母线为节点。
- 电气网络: 通过零阻抗和无限阻抗元素(如短线路、闭合/断开断路器)推导。
数据质量
- 同步精度: 现场测试显示,同步误差方差为0.625度。
- 传感器误差: 传感器误差通常小于0.5%,但在轻载电路中使用过大的电流互感器时误差较大。
- 数据缺失: 由于网络和电源中断、系统维护等原因,数据中偶尔存在缺失。
- 电路拓扑和参数: 实际中,配电系统操作员很少维护无错误的系统记录,部分信息为估计值。
快速开始与代码示例
- 加载数据: 参见
data_IO.ipynb中的示例代码。 - 状态估计 (同步相量): 提供示例代码。
- 电压控制: 使用线性分布式流模型 (LinDistFlow) 进行电压控制。
- 状态估计 (同步波形): 提供示例代码,参见
code_examples/state_estimation_waveform.ipynb。
引用
- IEEE: 待补充
- BibTex: 待补充
联系方式
- 邮箱:
digitaltwin@caltech.edu - GitHub Issues: https://github.com/caltech-netlab/digital-twin-dataset/issues
- Pull requests: https://github.com/caltech-netlab/digital-twin-dataset/pulls
免责声明
数据的准确性或可靠性不作任何保证,提供者不承担任何责任。
搜集汇总
数据集介绍

构建方式
该数据集由美国配电系统运营商合作伙伴提供,经过匿名化处理以移除所有地理标识符。数据涵盖了多种时间序列数据,包括电流和电压的均方根值、同步相量测量以及原始波形数据,采样频率从1秒到2.5kHz不等。此外,数据集还包含了电路拓扑和参数信息,如线路连接性、变压器铭牌额定值和断路器状态等。这些数据通过高精度的传感器和同步技术采集,确保了数据的实时性和准确性。
使用方法
用户可以通过下载样本数据集进行初步实验,样本数据与完整数据集的数据类型一致,但时间范围较小,便于快速验证代码。完整数据集预计于2025年2月开放访问,用户需提交申请。数据集的使用方法包括数据加载、状态估计和电压控制等,具体示例代码可在`data_IO.ipynb`中找到。用户还可以根据波形数据和电路参数进行时域电路功率流的仿真,相关实现细节在论文的V(b)和VI(b)部分有详细描述。
背景与挑战
背景概述
digital-twin-dataset数据集由美国合作伙伴配电系统运营商提供,数据经过匿名化处理以移除所有地理标识符。该数据集旨在为电力系统的数字孪生技术提供支持,涵盖了电流和电压的均方根值、同步相量测量以及原始波形数据等多种时间序列数据。此外,数据集还包含电路拓扑和参数信息,如线路连接性、变压器铭牌额定值和断路器状态等。该数据集的核心研究问题在于如何利用高精度的时间序列数据和电路拓扑信息,构建电力系统的精确数字模型,从而支持电力系统的实时监控、状态估计和电压控制等应用。该数据集由加州理工学院的研究团队主导开发,预计于2025年2月正式发布完整版本,目前提供样本数据集供研究人员初步探索。
当前挑战
digital-twin-dataset数据集在构建和应用过程中面临多重挑战。首先,数据的高精度要求与传感器误差之间的矛盾显著,尽管传感器误差通常控制在0.5%以内,但在轻载电路中使用的大型电流互感器可能导致更高的误差。其次,数据同步问题突出,现场测试显示同步误差方差为0.625度,这对相位角敏感的电力系统分析提出了更高要求。此外,数据中存在不可避免的缺失,如网络和电力中断、系统维护等导致的间隙,这要求研究人员开发鲁棒的数据处理方法。最后,电路拓扑和参数信息的准确性难以完全保证,尤其是线路绝缘材料、长度和变压器分接头位置等信息的估计可能引入不确定性,这对数字孪生模型的精确性提出了挑战。
常用场景
经典使用场景
在电力系统研究中,digital-twin-dataset数据集被广泛应用于电力网络的实时监控与状态估计。通过提供高精度的同步相量、波形数据以及电路拓扑信息,研究人员能够构建精确的电力系统数字孪生模型,从而实现对电网状态的实时分析与预测。
解决学术问题
该数据集解决了电力系统中数据稀缺与不精确的问题,特别是在分布式电网的实时监控与故障诊断领域。通过提供高分辨率的时间序列数据,研究人员能够更准确地模拟电网的动态行为,进而优化电网的运行效率与稳定性。
实际应用
在实际应用中,digital-twin-dataset数据集被用于智能电网的电压控制与功率流优化。电力公司利用该数据集中的同步相量数据,能够实时调整电网的运行参数,确保电力供应的稳定性与高效性,特别是在应对突发负载变化或故障时表现出色。
数据集最近研究
最新研究方向
在电力系统数字孪生领域,`digital-twin-dataset`数据集的最新研究方向聚焦于高精度同步测量数据的应用与优化。随着智能电网技术的快速发展,同步相量测量单元(PMU)和波形数据的精确性成为研究热点。该数据集提供的同步相量和波形数据,为电力系统状态估计、故障检测和电压控制等关键问题提供了丰富的研究素材。特别是在动态电路模型和时域功率流分析中,数据集的高粒度数据支持了复杂电力网络行为的精确模拟。此外,数据集中的电路拓扑和参数信息为电力系统的物理资产网络建模提供了重要参考,推动了电力系统数字孪生技术的实际应用与优化。
以上内容由遇见数据集搜集并总结生成



