Individual Household Electric Power Consumption Dataset

github2024-06-19 更新2024-06-24 收录

下载链接：

https://github.com/Lokesh-Project/Time-Series-Forecasting

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含一个家庭近4年内的电力消耗测量数据，采样频率为每分钟一次。数据集经过清洗，本项目中使用了前60天的数据，包含7个按时间排序的特征。

This dataset contains measured electric power consumption data from a single household over nearly four years, sampled at a frequency of one measurement per minute. The dataset has been cleaned, and the first 60 days of data utilized in this project include 7 time-sorted features.

创建时间：

2024-06-19

原始信息汇总

数据集概述

项目描述

本项目涉及构建和训练一个神经网络，用于预测多元家庭电力消耗时间序列数据集的时间索引变量。模型使用过去24个观测窗口的7个变量来预测接下来24个观测的相同变量。

数据集

数据集是“Individual Household Electric Power Consumption Dataset”的一个子集，该数据集记录了一个家庭近4年的电力消耗数据，采样频率为每分钟一次。本项目使用的数据集已清洗并缩减为前60天的数据，包含7个按时间排序的特征。

来源： Individual Household Electric Power Consumption Dataset

模型要求

输入形状： (BATCH_SIZE, 24, 7)
输出形状： (BATCH_SIZE, 24, 7)
最后一层必须是具有7个神经元的Dense层。
不得更改常量，如SPLIT_TIME、N_FEATURES、BATCH_SIZE、N_PAST、N_FUTURE和SHIFT。
数据归一化代码不得更改。
数据集窗口化代码不得更改。
种子设置代码不得更改。

使用说明

下载和提取数据集 数据集通过download_and_extract_data()函数自动下载和提取。
数据归一化 数据集通过normalize_series()函数使用最小-最大缩放进行归一化。
窗口化数据集 windowed_dataset()函数将时间序列数据集映射为用于训练和验证的特征窗口和相应目标。
模型定义 模型采用双向LSTM架构，包括：
- 输入层，形状为(24, 7)
- 双向LSTM层
- RepeatVector层，以匹配未来预测步骤
- TimeDistributed Dense层，输出每个未来步骤的7个特征
模型编译和训练 模型使用Adam优化器和MSE损失进行编译，并训练10个周期。
模型保存 训练后的模型保存为mymodel.h5。

搜集汇总

数据集介绍

构建方式

该数据集源自Individual Household Electric Power Consumption Dataset，经过精心筛选与处理，保留了前60天的电力消耗数据。数据以每分钟一次的频率记录，涵盖了近四年的用电情况。为适应时间序列预测任务，数据集被进一步分割为多个24小时的时间窗口，每个窗口包含7个特征变量。通过这种方式，数据集不仅保留了原始数据的丰富信息，还为模型训练提供了结构化的输入输出对。

使用方法

使用该数据集时，首先需通过提供的函数自动下载并解压数据。随后，数据将通过标准化处理以适应模型输入要求。接着，利用windowed_dataset函数将时间序列数据转换为适合训练的窗口化数据集。模型定义采用双向LSTM架构，通过多次LSTM层的堆叠和时间分布密集层的输出，实现对未来24小时电力消耗的预测。训练完成后，模型可保存为.h5格式，便于后续应用。

背景与挑战

背景概述

个体家庭电力消耗数据集（Individual Household Electric Power Consumption Dataset）是一个专注于家庭电力消耗时间序列分析的数据集，由研究人员Lokesh Kollareddy创建。该数据集收集了单个家庭在近四年内的电力消耗数据，采样频率为每分钟一次，涵盖了七个关键变量。这一数据集的创建旨在支持时间序列预测模型的开发与验证，特别是在家庭能源管理与优化领域。通过提供详尽的电力消耗记录，该数据集为研究人员提供了一个宝贵的资源，以探索和改进家庭能源消耗的预测模型，从而推动能源效率和可持续发展的研究。

当前挑战

该数据集在构建和应用过程中面临多项挑战。首先，数据集的原始数据量庞大，处理和清洗这些数据以确保其质量和一致性是一项复杂任务。其次，时间序列数据的特性使得模型训练和验证需要特别关注数据的时序依赖性，这增加了模型设计的复杂性。此外，尽管数据集已经过初步处理，但在实际应用中，如何有效地处理缺失值和异常值，以及如何选择合适的窗口大小和滑动步长，仍然是模型性能优化的关键挑战。最后，数据集的应用场景广泛，从家庭能源管理到智能电网优化，不同应用场景对模型的要求各异，这也增加了模型泛化能力的挑战。

常用场景

经典使用场景

在电力消耗预测领域，Individual Household Electric Power Consumption Dataset 数据集的经典使用场景主要集中在时间序列预测上。通过构建和训练神经网络模型，研究人员能够利用过去24小时的电力消耗数据，预测未来24小时的电力消耗情况。这种预测模型不仅有助于优化家庭能源管理，还能为电力公司提供更精确的需求预测，从而提高电网的稳定性和效率。

解决学术问题

该数据集解决了时间序列预测中的多个学术研究问题，特别是在多变量时间序列数据的处理和预测方面。通过提供高频率的电力消耗数据，研究人员能够深入探讨如何利用历史数据来预测未来的电力需求，从而推动时间序列分析和机器学习算法的发展。此外，该数据集还为研究能源效率和可持续性提供了宝贵的实证数据，有助于推动相关领域的理论和实践进步。

实际应用

在实际应用中，Individual Household Electric Power Consumption Dataset 数据集被广泛用于智能家居系统和能源管理平台的开发。通过分析家庭电力消耗模式，这些系统能够自动调整家电的使用时间，优化能源分配，从而降低家庭电费支出。此外，电力公司也可以利用这些预测数据来优化电网调度，减少能源浪费，提高供电可靠性。

数据集最近研究