London Smart Meters dataset

github2023-08-10 更新2024-05-31 收录

下载链接：

https://github.com/Niloy-Chakraborty/Time-Series_Stream_Clustering_on_London_Smart_Meter_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

伦敦智能电表数据集包含从2013年1月1日0:00至2014年1月1日0:00的1130个智能电表数据，时间间隔为30分钟。数据集还包括每个智能电表的acorn分布。每个智能电表的电价类别（如标准、动态分时使用（dToU）等）、Acorn类别（如ACORN-H、ACORN-N、ACORN-Q等：总计19种）和Acorn组（如舒适、逆境、富裕和ACORN-U，总计4种）也在数据集中提及。

The London Smart Meter Dataset encompasses data from 1,130 smart meters, recorded from 00:00 on January 1, 2013, to 00:00 on January 1, 2014, with a 30-minute interval. The dataset also includes the acorn distribution for each smart meter. It details the tariff categories (such as standard, dynamic time of use (dToU), etc.), Acorn categories (e.g., ACORN-H, ACORN-N, ACORN-Q, etc.: 19 in total), and Acorn groups (such as Comfortable, Adversity, Affluent, and ACORN-U: 4 in total) for each smart meter.

创建时间：

2020-05-28

原始信息汇总

数据集概述

数据集基本信息

名称: 伦敦智能电表数据集
时间范围: 2013年1月1日0:00至2014年1月1日0:00
采样频率: 每30分钟一次
电表数量: 1130个
附加信息: 包含每个电表的ACORN分布、电价类别（标准、动态时间使用等）、ACORN类别（共19种）和ACORN组（共4种）

数据分析与创建

原始数据结构: 包含两个数据框，第一个包含电表时间序列数据（17568行，1132列），第二个包含每个电表的ACORN分布（1130行，4列）
数据转换: 为了根据能源消耗进行电表聚类，数据进行了转置，增加了数据维度至17568
特征工程: 创建了新数据框，包含每周总消耗（53列）和每月总消耗（13列）等新特征，以提高聚类质量

数据预处理

数据清洗: 纠正了一个电表ID的ACORN组名错误，并移除了该记录
缺失值处理: 尽管数据集中无缺失值，但采用了线性插值或均值填充作为标准处理方法
数据标准化: 使用MinMax Scaler对数据进行缩放，确保计算距离时不被大数值主导
编码处理: 对分类数据进行编码，尽管数据集仅包含浮点值，但电表ID被视为分类变量并转换为整数

聚类算法

应用算法:
1. K-Means聚类
2. 层次聚类
3. DBSCAN聚类
4. 自编码器辅助的K-Means聚类

实验与结果

聚类效果: 自编码器辅助的K-Means聚类表现最佳，轮廓系数为0.52，重建准确率为85%，重建损失为0.002
可视化分析: 通过多种图表展示了电表数据在不同季节、日消费模式、季度消费分布等方面的聚类结果，揭示了不同聚类在特定条件下的消费特征
自消费计算: 对每个电表ID进行了自消费量的计算，并使用Violin图展示了ACORN组和类别的自消费分布

结论

聚类分析: 尽管自编码器辅助的K-Means聚类在技术上表现出色，但聚类结果与ACORN组或类别的关联性不强，表明能源消耗模式在不同ACORN组或类别间可能相似，导致聚类时难以区分

搜集汇总

数据集介绍

构建方式

London Smart Meters数据集构建于2013年1月1日至2014年1月1日期间，涵盖了1130个智能电表的数据，采样间隔为30分钟。数据集不仅包含电表的能耗时间序列数据，还记录了每个电表的Acorn分布信息，包括电价类别、Acorn类别和Acorn组别。为了便于聚类分析，数据集经过转置处理，增加了数据维度，并通过生成新的特征如周总能耗和月总能耗来降低维度，提升计算效率。

特点

该数据集的特点在于其丰富的时间序列数据和多维特征信息。每个电表的能耗数据以30分钟为间隔记录，时间跨度长达一年，提供了详尽的能耗模式分析基础。此外，数据集还包含了Acorn分布信息，能够帮助研究者从社会经济角度分析能耗模式。通过数据预处理，如缺失值插补、数据缩放和类别编码，数据集的质量得到了进一步提升，确保了后续聚类分析的准确性。

使用方法

该数据集的使用方法主要围绕时间序列聚类展开。研究者可以首先对数据进行预处理，包括缺失值处理、数据缩放和类别编码。随后，使用K均值聚类、层次聚类、DBSCAN聚类或基于自编码器的K均值聚类等算法对电表能耗数据进行聚类分析。通过计算轮廓系数等指标，评估聚类效果，并进一步分析不同季节、天数和Acorn组别的能耗模式。最终，研究者可以通过可视化工具展示聚类结果，深入理解电表能耗的分布规律。

背景与挑战

背景概述

伦敦智能电表数据集（London Smart Meters dataset）由1130个智能电表的数据组成，时间跨度为2013年1月1日至2014年1月1日，数据采集间隔为30分钟。该数据集不仅记录了每个电表的能耗数据，还包含了每个电表的Acorn分类信息，如Tariff类别、Acorn类别和Acorn组别。该数据集的核心研究问题在于通过时间序列聚类技术，分析不同电表的能耗模式，进而揭示用户群体的用电行为特征。该数据集为智能电网领域的能耗分析提供了重要的数据支持，推动了基于机器学习的能耗预测和用户行为分析的研究。

当前挑战

伦敦智能电表数据集在应用过程中面临多重挑战。首先，数据的高维性（17568行，1132列）增加了聚类算法的计算复杂度，尤其是在时间序列数据的处理中，如何有效降维并保留关键信息成为一大难题。其次，数据预处理阶段需解决缺失值处理、数据标准化和类别编码等问题，以确保算法的鲁棒性。此外，尽管数据集包含了Acorn分类信息，但聚类结果显示，不同Acorn组别和类别的电表在能耗模式上并无显著差异，这为基于用户特征的能耗分析带来了挑战。最后，如何选择合适的聚类算法并优化其参数，以获得具有实际意义的聚类结果，也是该数据集应用中的关键问题。

常用场景

经典使用场景

London Smart Meters数据集在能源管理领域具有广泛的应用，尤其是在智能电表数据的聚类分析中。该数据集包含了1130个智能电表在2013年全年每30分钟的用电数据，结合了不同用户的电价类别和Acorn分类信息。通过对这些时间序列数据进行聚类分析，研究人员能够更好地理解不同用户群体的用电模式，从而为电力公司提供优化电力分配和需求响应的依据。

实际应用

在实际应用中，London Smart Meters数据集为电力公司提供了宝贵的用户用电行为数据。通过对这些数据的分析，电力公司可以更好地预测高峰时段的用电需求，优化电网的负载管理，并制定更具针对性的电价策略。此外，该数据集还为智能电网的建设和需求响应系统的设计提供了数据支持，帮助电力公司提高能源利用效率，降低运营成本。

衍生相关工作

基于London Smart Meters数据集，许多经典的研究工作得以展开。例如，研究人员开发了基于自编码器的K-Means聚类算法，显著提高了时间序列数据的聚类效果。此外，该数据集还推动了智能电表数据分析领域的多项研究，包括用电模式识别、用户行为分析以及电力需求预测等。这些研究不仅丰富了智能电网的理论基础，还为实际应用提供了有力的技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集