five

LCPR 数据集

收藏
arXiv2025-04-17 更新2025-04-20 收录
下载链接:
https://github.com/jupall/lcpr-data
下载链接
链接失效反馈
官方服务:
资源简介:
LCPR数据集是由蒙特利尔理工学院的研究人员开源的,包含两个年份的聚合消费数据,用于展示北部气候下局部化临界峰值返利(LCPR)机制。该数据集涉及参与LCPR项目的蒙特利尔魁北克加拿大三个相邻配电变电站的客户。数据集旨在促进对值得信赖的机器学习模型在需求响应应用中的研究。

The LCPR dataset was open-sourced by researchers at Polytechnique Montréal. It includes two years of aggregated consumption data, intended to demonstrate the localized critical peak rebate (LCPR) mechanism under northern climatic conditions. This dataset covers customers from three adjacent distribution substations in Montreal, Quebec, Canada that participated in the LCPR project. The dataset aims to facilitate research on trustworthy machine learning models for demand response applications.
提供机构:
蒙特利尔理工学院
创建时间:
2025-04-17
搜集汇总
数据集介绍
main_image_url
构建方式
LCPR数据集通过整合来自蒙特利尔三个相邻变电站的197名匿名测试者的聚合小时用电量数据构建而成。该数据集不仅包含用电量数据,还融合了每小时的气象信息及LCPR事件标记,覆盖了2022年1月至2024年6月的时间范围。数据采集过程中保留了计量异常和通信故障导致的离群值,并通过与Hydro-Québec及Hilo的合作确保了数据的真实性和地理特异性。数据预处理阶段采用标准化时间戳、处理缺失值及异常检测流程,最终形成包含21个特征的结构化时间序列数据集。
使用方法
该数据集适用于时间序列预测、异常检测及需求响应策略评估三类研究场景。使用时应首先按变电站分区进行数据分割,建议采用滚动时间窗口策略划分训练集与测试集,其中2023年12月15日前数据推荐用于模型训练,后续冬季数据用于性能验证。对于预测任务,可结合高斯过程模型,配置包含径向基函数、周期核和白噪声核的混合核函数。异常检测研究可采用论文提出的FEAD方法,通过欧氏距离阈值η控制过滤严格度。特征工程阶段需特别注意温度设定点、室外温度等与用电量呈强Spearman相关的特征(|ρ|>0.5)。
背景与挑战
背景概述
LCPR数据集由蒙特利尔理工大学的Julien Pallage和Antoine Lesage-Landry团队于2025年创建,旨在填补北方气候条件下局部关键峰时回扣(Localized Critical Peak Rebates, LCPR)机制研究的数据空白。该数据集收录了蒙特利尔三个相邻变电站197名参与者的聚合小时用电量数据,并附带了气象信息和LCPR事件标记。作为首个公开的北方气候LCPR数据集,其核心研究问题聚焦于如何通过数据驱动方法优化需求响应机制,特别是在高纬度地区电网面临极端天气和峰时负荷挑战的背景下。该数据集的发布为虚拟电厂(VPP)和分布式能源资源(DER)管理领域提供了重要的实验基准,推动了可信机器学习在能源系统中的应用。
当前挑战
LCPR数据集面临双重挑战:在领域问题层面,需解决北方气候特有的用电行为模式捕捉、局部电网压力事件预测,以及高噪声环境下消费基线估计等难题;在构建过程中,数据质量受限于智能电表读数异常、通信中断导致的遥测数据丢失,以及极端天气事件造成的异常值干扰。此外,隐私保护要求导致用户级细粒度数据不可用,仅能提供聚合数据,这增加了从宏观数据中提取有效特征的难度。数据集的时间跨度虽覆盖完整冬季峰时周期,但样本量受限于参与用户规模,对机器学习模型的泛化能力提出更高要求。
常用场景
经典使用场景
LCPR数据集在能源管理和机器学习领域具有重要应用,特别是在虚拟电厂(VPP)和需求响应(DR)研究中。该数据集记录了蒙特利尔地区三个相邻变电站的197名匿名用户的小时用电量,结合气象数据和LCPR事件信息,为研究高纬度气候下的需求响应机制提供了宝贵资源。数据集最经典的使用场景是训练和验证用于预测用户用电行为的机器学习模型,尤其是在冬季用电高峰期。研究人员可以通过分析用户对LCPR事件的响应模式,优化需求响应策略的设计和实施。
解决学术问题
LCPR数据集解决了能源领域多个关键学术问题。首先,它填补了高纬度地区LCPR机制开源数据的空白,为研究极端气候条件下的需求响应提供了实证基础。其次,数据集中的异常值(如32.2MWh的异常用电记录)使得研究者能够开发更鲁棒的异常检测算法。最重要的是,该数据集支持开发考虑空间粒度、行为特征和物理约束的预测模型,推动了可信机器学习在关键能源应用中的发展。这些研究对于提高电网灵活性、促进可再生能源整合具有重要意义。
实际应用
在实际应用中,LCPR数据集可直接支持电力公司的运营决策。通过分析数据集中的用电模式,运营商可以更准确地预测局部电网的峰值负荷,从而优化LCPR事件的调度时机和激励强度。数据集还能帮助评估不同气候条件下需求响应项目的效果,为电力市场设计提供依据。此外,该数据集已被用于开发基于高斯过程的预测模型,其在实际测试中展现出的性能(如变电站C的MAE为41.22kWh)证明了其在现实场景中的实用价值。
数据集最近研究
最新研究方向
LCPR数据集作为首个展示北方气候条件下局部关键峰值回扣需求响应的开源数据集,为虚拟电厂(VPP)和分布式能源资源(DER)管理领域提供了宝贵的研究资源。该数据集的最新研究方向主要集中在基于切片-瓦瑟斯坦距离(Sliced-Wasserstein Distance)的无监督异常检测方法,用于机器学习训练数据的选择。这一方法通过评估数据样本与数据集其余部分的传输成本,有效识别异常数据,从而提升模型在关键领域(如电力系统)中的决策可靠性。此外,该研究还提出了两种高效近似方法——智能分割法和快速欧几里得近似法,以应对大规模数据集的扩展性问题。这些方法不仅在合成数据集上展示了优异的过滤性能,还在实际应用中为LCPR机制的预测提供了首个基准测试。LCPR数据集的发布填补了北方气候条件下需求响应研究的数据空白,推动了可信机器学习模型在能源管理中的应用。
相关研究论文
  • 1
    Sliced-Wasserstein Distance-based Data Selection蒙特利尔理工学院 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作