five

Metering Anomaly Diagnosis(MAD)

收藏
github2025-06-18 更新2025-07-09 收录
下载链接:
https://github.com/IISGLab/MeteringAnomalyDiagnosis
下载链接
链接失效反馈
官方服务:
资源简介:
Metering Anomaly Diagnosis (MAD) 是一个用于智能电网变电站的计量异常诊断数据集,用于支持多元时间序列分类研究。数据完全来源于实际部署的高级计量基础设施(AMI)系统,对工程应用具有重要的实际意义。该数据集包含504个三相四线智能电表,其中382个正常运行,122个经过人工现场检查或专业标记为具有各种异常。采样间隔为30分钟。样本按每日周期划分,每个样本包含48个数据点。数据集预处理已完成,共生成7,733个可用样本,存储在MAD.npz文件中。训练集和测试集已经划分,分别包含2,319和5,414个样本。样本分为7类,其中0表示正常运行,类别1-6代表六种不同的异常类型。

Metering Anomaly Diagnosis (MAD) is a metering anomaly diagnosis dataset for smart grid substations, designed to support multivariate time series classification research. The data is entirely sourced from actually deployed Advanced Metering Infrastructure (AMI) systems, holding significant practical value for engineering applications. This dataset contains 504 three-phase four-wire smart meters, among which 382 operate normally, and 122 have been manually inspected on-site or professionally labeled as having various anomalies. The sampling interval is 30 minutes. Samples are divided on a daily cycle, with each sample containing 48 data points. Data preprocessing has been completed, with a total of 7,733 usable samples generated and stored in the MAD.npz file. The training and test sets have been split, containing 2,319 and 5,414 samples respectively. Samples are categorized into 7 classes, where class 0 indicates normal operation, and classes 1 to 6 represent six distinct anomaly types.
创建时间:
2025-06-17
原始信息汇总

Metering Anomaly Diagnosis (MAD) 数据集概述

数据集简介

  • 目的:支持智能电网变电站中智能电表的多元时间序列分类研究。
  • 数据来源:实际部署的高级计量基础设施(AMI)系统。
  • 电表数量:504台三相四线智能电表(正常382台,异常122台)。
  • 采样间隔:30分钟。
  • 样本划分:按每日周期划分,每个样本包含48个数据点。

数据集构成

  • 总样本数:7,733个可用样本。
  • 训练集:2,319个样本(x_train, y_train)。
  • 测试集:5,414个样本(x_test, y_test)。
  • 存储格式:MAD.npz文件。

样本类别分布

类别ID 描述 样本数量
0 正常 6,021
1 异常-1 265
2 异常-2 124
3 异常-3 128
4 异常-4 747
5 异常-5 120
6 异常-6 328

样本特征

  • 数据来源:三相四线智能电表。
  • 变量数量:14个(3相电压、3相电流、总有功功率、3相有功功率、总功率因数、3相功率因数)。
  • 预处理:所有变量已归一化。

引用格式

bibtex @misc{MAD, author = {Wang, F.}, title = {{Metering Anomaly Diagnosis}}, year = {2025}, note = {https://github.com/IISGLab/MeteringAnomalyDiagnosis} }

搜集汇总
数据集介绍
构建方式
MAD数据集构建基于实际部署的高级计量基础设施(AMI)系统,确保了数据的真实性和工程应用价值。数据集涵盖504台三相四线智能电表,其中382台运行正常,122台经人工现场检查或专业标注存在各类异常。采样间隔为30分钟,以每日周期划分样本,每个样本包含48个数据点。经过预处理后,数据集共包含7,733个可用样本,存储为MAD.npz文件,并已划分为2,319个训练样本和5,414个测试样本。
使用方法
MAD数据集以.npz格式存储,用户可通过(x_train, y_train, x_test, y_test)直接提取已划分的训练集和测试集。每个样本包含48个时间步长的14维特征,标签对应7种分类类别。研究人员可利用该数据集开发多元时间序列分类算法,特别适用于智能电网场景下的异常检测研究。使用该数据集时,需引用相关文献以尊重数据贡献者的工作。
背景与挑战
背景概述
Metering Anomaly Diagnosis(MAD)数据集由Wang F.等人于2025年发布,旨在为智能电网变电站中的智能电表异常诊断研究提供支持。该数据集源自实际部署的高级计量基础设施(AMI)系统,包含504台三相四线智能电表的数据,其中382台运行正常,122台存在各类异常。数据采样间隔为30分钟,按日周期划分样本,每个样本包含48个数据点。MAD数据集经过预处理,提供7,733个可用样本,涵盖7种运行状态,为多元时间序列分类研究提供了重要资源。该数据集在智能电网故障检测和能源管理领域具有显著的工程应用价值。
当前挑战
MAD数据集面临的挑战主要体现在两个方面。在领域问题层面,智能电表异常诊断需要处理高维多元时间序列数据,如何有效捕捉不同异常模式的时序特征并实现精准分类是核心难题。六类异常样本分布不均衡(如Abnormal-2仅124个样本,而Abnormal-4达747个),加剧了模型训练的难度。在构建过程层面,原始数据采集需协调实际AMI系统的部署规模与数据质量,异常样本的现场验证和专业标注耗费大量人力成本。14个变量的归一化处理与48个时间步长的特征提取,对数据预处理方法提出了较高要求。
常用场景
经典使用场景
在智能电网领域,MAD数据集为多元时间序列分类研究提供了重要支持。该数据集通过采集三相四线智能电表的电压、电流、功率等14个变量,构建了包含7类异常状态的标注样本,为异常检测算法提供了标准化的评估基准。其30分钟采样间隔和按日划分的样本结构,完美契合电力系统运行监测的实际需求,成为时间序列分类领域的经典案例。
解决学术问题
MAD数据集有效解决了智能电网中电表异常诊断的关键学术难题。通过提供真实AMI系统采集的7类异常数据,该数据集填补了电力计量领域缺乏标准化评估基准的空白。其精确标注的异常类型为研究新型异常检测算法、特征提取方法以及分类模型优化提供了可靠的数据支撑,显著提升了学术界对电力计量异常模式识别的研究深度。
实际应用
在实际工程应用中,MAD数据集被广泛用于智能变电站的运维监测系统开发。基于该数据集训练的异常诊断模型可实时检测电表计量偏差、接线错误等故障,大幅提升电网公司的计量设备管理效率。其标准化数据格式与真实场景的高度吻合,使得研究成果能够快速转化为实际部署的监测解决方案。
数据集最近研究
最新研究方向
在智能电网计量异常诊断领域,MAD数据集因其真实部署的高级计量基础设施(AMI)系统数据而备受关注。该数据集为多元时间序列分类研究提供了丰富资源,涵盖了七种不同类别的计量异常情况,包括正常操作和六种异常类型。当前研究聚焦于利用深度学习模型,如长短期记忆网络(LSTM)和Transformer架构,提升异常检测的准确性和效率。随着智能电网的普及,计量异常诊断在保障电网稳定运行和能源管理中的重要性日益凸显,MAD数据集的应用正推动着该领域的技术革新和工程实践。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作