Localized Critical Peak Rebates (LCPR) Dataset
收藏arXiv2024-10-29 更新2024-10-31 收录
下载链接:
https://github.com/jupall/swfilter
下载链接
链接失效反馈官方服务:
资源简介:
Localized Critical Peak Rebates (LCPR) Dataset是由蒙特利尔综合理工学院和Hydro-Québec合作创建的,旨在展示在北方气候下的本地化关键峰值回扣需求响应机制。该数据集包含197名匿名LCPR测试者的每小时能耗数据,以及额外的每小时天气数据和LCPR信息。数据集的创建过程包括对智能电表和遥测数据的聚合,以及对异常值的处理。该数据集主要用于训练和验证机器学习模型,特别是在能源需求响应和智能电网管理领域,旨在解决冬季高峰期电力需求预测和优化问题。
The Localized Critical Peak Rebates (LCPR) Dataset was co-developed by École Polytechnique de Montréal and Hydro-Québec, aiming to demonstrate the localized critical peak rebate demand response mechanism under northern climatic conditions. This dataset contains hourly energy consumption data from 197 anonymized LCPR test participants, along with additional hourly weather data and LCPR-related information. The dataset creation process includes the aggregation of smart meter and telemetry data as well as outlier handling. This dataset is primarily used for training and validating machine learning models, especially in the fields of energy demand response and smart grid management, with the goal of addressing winter peak electricity demand forecasting and optimization issues.
提供机构:
蒙特利尔综合理工学院,GERAD & Mila
创建时间:
2024-10-29
原始信息汇总
swfilter
简介
本项目提出了一种使用切片Wasserstein度量(Sliced-Wasserstein Metric)的新型无监督异常检测(AD)方法。该过滤技术在能源等关键领域的MLOps管道中部署可信机器学习模型方面具有概念上的吸引力。此外,还提出了一种使用快速欧几里得变体的近似方法。代码遵循scikit-learn的API,可以像其他scikit-learn AD方法(如Isolation Forest、Local Outlier Factor)一样调用。
实现方式
使用POT库中的切片Wasserstein距离的Python实现,并通过投票系统将候选样本标记为异常值或正常值,使用joblib并行化处理过程。
使用方法
python from swfilter import SlicedWassersteinFilter eps = 0.01 # SW距离的阈值 n = 30 # 投票者数量 n_projections = 50 # SW计算中使用的投影数量 p = 0.6 # 标记为异常值所需的投票者百分比阈值 n_jobs = -1 # 并行化中调用的工作者数量(-1 = 最大值)
model = SlicedWassersteinFilter(eps=eps, n=n, n_projections=n_projections, p=p, n_jobs=n_jobs, swtype=original) preds, vote = model.fit_predict(dataset)
mask = preds == 1 filtered_dataset = dataset[mask]
安装
即将推出!
教程
查看我们的教程页面!
引用与论文
即将推出!
搜集汇总
数据集介绍

构建方式
Localized Critical Peak Rebates (LCPR) Dataset 由 Hydro-Québec 和 Polytechnique Montréal 的研究团队共同构建,旨在提供一个展示北部气候下本地化关键峰值回扣需求响应机制的开源数据集。该数据集包含了两年内蒙特利尔地区参与 LCPR 计划的 197 名匿名测试者的每小时能耗数据,以及相关的天气数据和 LCPR 信息。数据集的构建过程中,研究团队还提供了时间特征的周期性编码,如月份、星期几和小时,以增强数据集的多样性和复杂性。
特点
LCPR 数据集的主要特点在于其高度的本地化特性和对北部气候的适应性。数据集不仅包含了详细的能耗数据,还整合了天气信息,使得研究者能够更全面地分析和预测能耗模式。此外,数据集中存在的异常值和异常情况,如计量和遥测问题或停电事件,为异常检测和过滤技术提供了实际应用场景,增强了数据集在机器学习模型训练中的实用性和挑战性。
使用方法
LCPR 数据集适用于多种机器学习应用,特别是在需求响应和异常检测领域。研究者可以利用该数据集训练和验证预测模型,以预测在关键峰值时段的本地化能耗。此外,数据集中的异常值和异常情况为异常检测算法提供了理想的测试平台。研究者可以通过分析数据集中的时间序列特征和天气数据,开发和优化基于 Sliced-Wasserstein 距离的异常过滤技术,从而提高模型的鲁棒性和预测精度。
背景与挑战
背景概述
Localized Critical Peak Rebates (LCPR) Dataset由Polytechnique Montréal、GERAD、Mila和Hydro-Québec的研究人员共同创建,旨在解决北部气候条件下电力系统的峰值需求响应问题。该数据集于2024年发布,主要研究问题是如何在不依赖新基础设施的情况下,通过需求响应机制缓解冬季高峰电力需求。LCPR数据集展示了在蒙特利尔地区参与LCPR计划的客户两年内的聚合能耗数据,以及相关的天气数据和LCPR信息。这一数据集的发布填补了相关领域在北部气候条件下需求响应机制研究的空白,为开发可信赖的机器学习模型提供了宝贵的资源。
当前挑战
LCPR数据集面临的挑战主要包括:1) 数据质量问题,如计量和遥测问题、仪表故障和极端事件导致的异常值,这些因素可能影响机器学习模型的预测质量;2) 数据集的构建过程中,如何有效过滤异常值以提高模型鲁棒性是一个关键问题;3) 在北部气候条件下,电力系统的峰值需求响应机制的研究相对不足,LCPR数据集的发布旨在填补这一研究空白,但其复杂性和高空间分辨率要求模型具备高性能保证、噪声鲁棒性、可解释性、物理约束满足和预测置信度等特性。
常用场景
经典使用场景
Localized Critical Peak Rebates (LCPR) Dataset 最经典的使用场景在于支持智能电网中的需求响应(DR)机制研究。该数据集通过提供蒙特利尔地区参与LCPR计划的客户在两年内的每小时能耗数据,以及相关的天气数据和LCPR事件信息,为研究者提供了一个全面的数据平台。研究者可以利用这些数据来开发和验证基于机器学习(ML)的预测模型,以预测在高峰需求期间的能耗变化,从而优化电力分配和减少对传统能源的依赖。
实际应用
在实际应用中,LCPR数据集为电力公司和政策制定者提供了一个强大的工具,用于评估和优化需求响应策略。通过分析数据集中的能耗模式和LCPR事件的影响,电力公司可以更有效地管理电力资源,减少高峰期的电力短缺风险。此外,该数据集还可以用于培训智能电网操作员,帮助他们更好地理解和应对复杂的电力需求变化,从而提高电网的整体效率和可靠性。
衍生相关工作
LCPR数据集的发布激发了大量相关研究工作,特别是在智能电网和需求响应领域。例如,研究者们基于该数据集开发了多种机器学习模型,用于预测和优化电力需求。此外,该数据集还促进了无监督异常检测方法的发展,这些方法在智能电网数据处理中具有重要应用。通过这些研究,LCPR数据集不仅推动了学术界对智能电网问题的深入理解,也为工业界提供了实用的解决方案。
以上内容由遇见数据集搜集并总结生成



