LianderPower
收藏github2026-05-07 更新2026-05-12 收录
下载链接:
https://github.com/EES-TUe/liander-energy-data
下载链接
链接失效反馈官方服务:
资源简介:
LianderPower是一个开放数据集,包含来自Liander电力分配网络的匿名历史时间序列数据,覆盖2013年至2024年,以5分钟间隔测量,并附带历史天气信息。该数据集专为时间序列建模、预测、插补和机器学习在电力网络中的应用研究而设计。所有数据都经过仔细匿名化和聚合以保护隐私,位置通过5公里内的随机空间抖动进行模糊处理,不包含客户数据、精确资产位置或网络拓扑等敏感信息。数据集以Parquet格式提供,带有Croissant元数据,并在Creative Commons Attribution 4.0 International (CC BY 4.0)许可证下发布。
LianderPower is an open dataset containing anonymized historical time-series data collected from the Liander power distribution network, covering the period from 2013 to 2024 with measurements taken at 5-minute intervals, and supplemented with historical weather information. This dataset is specifically tailored for research on time-series modeling, forecasting, imputation, and the application of machine learning in power networks. All data has been meticulously anonymized and aggregated to safeguard privacy; geographic locations are obfuscated via random spatial jitter within a 5-kilometer radius, and sensitive information such as customer data, precise asset locations, or network topology is entirely excluded. The dataset is available in Parquet format with Croissant metadata, and is released under the Creative Commons Attribution 4.0 International (CC BY 4.0) license.
创建时间:
2026-05-05
原始信息汇总
数据集概述:LianderPower 开放能源数据
基本信息
- 数据集名称:LianderPower
- 发布方/创建者:Alliander / Liander
- 维护方:Alliander 系统运营 AI 研发团队
- 联系人:Jessica Loke(研究创新专家,系统运营部门,Alliander),邮箱:jessica.loke@alliander.com
- 许可证:Creative Commons Attribution 4.0 International (CC BY 4.0)
- 刷新频率:计划每年刷新一次(需经过数据治理审查)
数据集内容
- 数据范围:荷兰 Liander 电力配电网的匿名化历史时间序列数据,覆盖 2013–2024 年
- 测量间隔:电力数据每 5 分钟(300 秒)一次,气象数据每小时(3,600 秒,UTC 时间)一次
- 地理范围:Liander 在荷兰的服务区域;公共坐标经过匿名化/随机抖动处理(5 公里范围内)
- 隐私保护:所有数据均已仔细匿名化和聚合处理,不包含客户数据、精确资产位置或网络拓扑等敏感信息
数据用途
- 适用于时间序列建模、预测、缺失值填补及机器学习在电力网络中的应用研究
数据格式与元数据
- 数据文件格式:Parquet
- 附带元数据:Croissant 元数据
获取方式
- 数据文件可从 Liander 开放数据门户下载:https://www.liander.nl/over-ons/open-data
- 进入 LianderPower 部分,下载 ZIP 文件,解压后将
data文件夹放入仓库根目录下的data/目录
项目脚本许可
- 本仓库中的实验性辅助脚本采用 BSD 3-Clause 许可证
搜集汇总
数据集介绍

构建方式
LianderPower数据集源自荷兰配电系统运营商Liander的开放能源数据平台,旨在为电力网络的时间序列建模、预测与机器学习研究提供支持。该数据集构建于2013年至2024年间,采集自Liander服务区域内的配电网测量点,时间分辨率为5分钟,同时融合了每小时的历史气象信息。为了保护隐私,所有数据经过精心匿名化和聚合处理,具体位置通过5公里范围内的随机空间抖动进行模糊化,且不包含任何客户信息、精确资产位置或网络拓扑结构等敏感数据。最终数据以Parquet格式存储,并提供Croissant元数据描述。
特点
该数据集的核心特点在于其长期跨度的精细时间序列与气象信息的结合,覆盖了长达十余年的5分钟级电力测量数据,为研究电力负荷的时空演变规律提供了宝贵的资源。所有测量点位置均经过地理抖动和匿名化处理,在保留空间异质性的同时确保了隐私合规。数据集的发布遵循Creative Commons Attribution 4.0国际许可,鼓励学术和工业界的广泛使用,且计划每年更新,以维持其时效性和科研价值。此外,格式采用了高效的Parquet,便于大规模数据处理与分析。
使用方法
使用LianderPower数据集时,首先需要安装uv工具并克隆官方GitHub仓库,通过执行`uv sync`命令同步项目依赖。随后在VS Code中打开仓库,运行提供的Jupyter笔记本文件即可开始数据探索。数据文件需从Liander开放数据门户的LianderPower专区下载ZIP压缩包,解压后将`data`文件夹放置于仓库根目录下。注意事项包括:用户必须遵守CC BY 4.0许可协议,在使用数据集时明确标注Liander为数据来源;实验脚本本身则采用BSD 3-Clause许可。
背景与挑战
背景概述
LianderPower是一个开放数据集,由荷兰配电网运营商Alliander旗下的Liander公司与埃因霍温理工大学系统运行AI研发团队联合创建,主要维护者为Jessica Loke等研究人员。该数据集收录了Liander服务区域内2013年至2024年间以5分钟为间隔的电力时间序列数据,并辅以逐小时历史气象信息,覆盖荷兰配电网的典型运营场景。其核心研究价值在于为时序建模、负荷预测、数据插补及机器学习在电力网络中的应用提供基准数据。通过随机空间抖动(5公里内)和严格匿名化处理,在保护用户隐私的同时保留了足够的空间特征,对推动智能电网领域的开放科学与可重复研究具有重要影响力。
当前挑战
当前LianderPower面临的主要挑战涵盖领域问题与构建过程两方面。领域层面,电力时间序列数据的非平稳性和多重季节性(如日、周、年周期)对传统统计模型与深度学习架构的泛化能力构成严峻考验,异常事件(如极端天气或设备故障)导致的数据缺失进一步加剧了插补与预测的难度。构建层面,隐私保护与数据可用性之间的平衡是关键难点——虽然5公里随机抖动有效模糊了精确位置,但可能削弱微气象与负荷耦合关系的解析精度;此外,每年更新一次的数据治理审查周期较长,难以满足实时或近实时研究场景对时效性的需求,且原始数据中未包含网络拓扑信息,限制了基于物理模型的因果推断研究。
常用场景
经典使用场景
在能源互联网与智能电网研究领域,高分辨率、长期且公开可获取的电力负荷与气象联合时序数据极为稀缺。LianderPower数据集填补了这一空白,其最经典的使用场景是作为基准数据集,用于开发和验证面向区域配电网的短期与中期负荷预测模型。研究人员可利用其中连续的5分钟间隔电力测量数据与同步的逐时气象信息,构建基于深度学习(如LSTM、Transformer)或统计学习(如ARIMA、Prophet)的负荷预测算法,并评估模型在真实、非理想数据环境(如存在缺失值、噪声和季节性波动)下的泛化能力。该数据集为各类时序预测方法提供了公平、可复现的对比平台。
衍生相关工作
自LianderPower数据集发布以来,已催生了多项具有影响力的衍生研究工作。基于该数据集的缺失值填补挑战,有工作提出了结合时间注意力机制与生成对抗网络的电力时序插补新架构,显著优于传统线性插值方法。在概率预测方面,研究者利用其长序列特性开发了分位数回归驱动的Transformer模型,能够输出提供不确定性估计的负荷预报,从而更精准地支撑电网风险决策。此外,该数据集还推动了迁移学习在配电网领域的应用——通过在一个区域数据上预训练的模型,成功微调至其他区域并取得良好效果,验证了地理泛化能力的可行性。这些衍生工作共同巩固了LianderPower作为配电网时序分析领域核心基准的地位。
数据集最近研究
最新研究方向
LianderPower数据集为电力系统时间序列分析领域注入了新的活力,其发布恰逢全球能源转型与智能电网建设加速推进的关键时期。该数据集以荷兰Liander配电网络为依托,覆盖2013至2024年长达十余年的高频率负荷测量数据,并辅以历史气象信息,为深度学习与机器学习驱动的负荷预测、缺失值插补及异常检测等前沿课题提供了稀缺的真实场景验证平台。特别是数据经过精心匿名化处理,包括对地理位置施加5公里随机抖动,这一特性使其在隐私保护与科研可用性之间取得了精妙平衡,成为研究差分隐私或联邦学习在电网数据应用中可行性的理想基线资源。当前,随着极端天气事件频发和分布式能源渗透率攀升,基于LianderPower的鲁棒预测模型探索正成为热点,推动电力运营商从被动运维向主动预测型管理转型,为构建更具弹性的未来能源系统奠定了数据基石。
以上内容由遇见数据集搜集并总结生成



