MiDAS传感器收集的电力使用和谐波数据集
收藏arXiv2022-11-14 更新2024-06-21 收录
下载链接:
https://github.com/ai4society/PowerIoT-State-Identification
下载链接
链接失效反馈官方服务:
资源简介:
本数据集由MiDAS传感器在8个机构(制造业、教育和医疗)中收集,涵盖美国和印度,用于分析电力使用模式。数据集包括电力消耗和谐波数据,总大小超过27GB,记录了15天的数据。数据集的创建旨在通过机器学习和人工智能方法,识别和预测电力系统的不同运行状态,如设备故障或正常运行,以优化能源管理。
This dataset was collected by MiDAS sensors across 8 institutions spanning manufacturing, education and healthcare in the United States and India, and is used for analyzing power usage patterns. It includes power consumption and harmonic data, with a total size of over 27 GB and 15 days of recorded data. The dataset was developed to identify and predict various operating states of power systems, such as equipment faults or normal operation, via machine learning and artificial intelligence methods, so as to optimize energy management.
提供机构:
南卡罗来纳大学人工智能研究所, Tantiv4
创建时间:
2022-08-30
搜集汇总
数据集介绍

构建方式
在电力系统监测领域,非侵入式负载监测技术因其低成本与易部署特性而备受关注。本数据集通过部署MiDAS物联网传感器,采集了来自美国与印度八个制造、教育和医疗机构的电力数据。传感器以300毫秒的间隔记录三相电压、电流、功率因数等28项电力消耗特征,并以500毫秒的间隔捕获2至32次谐波数据,涵盖193个谐波特征。数据采集周期为15天,遵循FAIR数据管理原则,确保数据的可发现性、可访问性、互操作性和可重用性。针对实际环境中可能出现的缺失数据,研究团队采用时间戳均值插补方法进行处理,以维持数据集的完整性与分析质量。
特点
该数据集的核心特点在于其多维性与跨行业代表性。数据不仅包含高频率的电力消耗时间序列,还提供了丰富的谐波频谱信息,为深入分析负载状态与设备性能创造了条件。数据集覆盖了激光切割机、医院主供电系统、数控机床等多种负载类型,反映了制造、医疗和教育领域的典型用电模式。数据规模庞大,仅15天的原始数据量已超过27GB,且允许研究者申请获取更长时间跨度的数据。这种跨地域、跨行业的多样性,使得数据集能够支持泛化性强的状态识别与异常检测模型开发。
使用方法
数据集适用于电力系统状态识别、非侵入式负载监测及能耗预测等研究任务。使用者可通过GitHub仓库获取数据,并依据提供的元数据与文档进行解析。对于状态识别问题,建议首先利用谐波数据特征,采用无监督聚类方法(如K均值)确定系统运行状态数量,再通过随机森林等分类器对观测数据进行状态标注。研究过程中可参考基线方案,使用肘部法则与轮廓系数评估聚类效果,并借助主成分分析实现高维数据的可视化。数据集中包含的缺失值处理代码也为用户提供了数据清洗的参考范例。
背景与挑战
背景概述
在物联网技术迅猛发展的背景下,电力能源管理领域正经历着深刻的变革。由南卡罗来纳大学AI研究所与Tantiv4公司合作创建的MiDAS传感器电力使用和谐波数据集,于2022年正式发布,旨在应对非侵入式负载监测中的状态识别核心问题。该数据集汇集了来自美国和印度八个制造、教育和医疗机构的电力消耗数据,通过高频率采集电流谐波与用电特征,为智能能源系统的优化提供了前所未有的数据基础。其跨行业、跨国别的数据构成,不仅推动了电力负载模式分析的精细化,也为机器学习在能源管理中的应用开辟了新的研究方向。
当前挑战
该数据集所针对的状态识别问题,面临着电力负载模式高度复杂与非线性的挑战,传统统计模型难以有效捕捉动态变化中的细微特征。在构建过程中,数据采集遭遇了现实环境中的多重困难:传感器网络可能因电力中断或设备故障导致数据缺失,部分位置缺失率高达10.29%,需通过均值插补等方法进行清洗;同时,高频采集产生的超过27GB海量时序与谐波数据,对存储与计算资源提出了严峻要求。此外,在无监督学习框架下,如何从高维特征中自动识别未知数量的系统状态,并确保算法在不同行业场景中的泛化能力,仍是亟待解决的核心难题。
常用场景
经典使用场景
在能源管理领域,MiDAS传感器收集的电力使用和谐波数据集为状态识别问题提供了关键数据支撑。该数据集通过非侵入式电力传感技术,捕捉了制造、教育和医疗等多个行业机构的电力消耗与谐波特征,为研究人员构建了分析电力系统运行状态的基准平台。经典使用场景包括利用无监督机器学习方法,如K-Means聚类,对电流谐波数据进行模式挖掘,从而识别不同负载条件下的系统状态,例如工厂设备的正常运行、故障预警或异常负载检测。
实际应用
在实际应用中,该数据集支持了工业与商业环境的能源监控与管理系统。例如,在制造工厂中,通过分析谐波数据可实时监测数控机床、激光切割机等设备的运行状态,实现预测性维护,减少停机时间。在医院和教育机构,数据集有助于优化主供电系统的负载分配,提升能源使用效率。此外,基于状态识别的结果可用于异常检测,如识别未经授权的设备使用或电力故障,为运营决策提供数据驱动的洞察,降低能源成本并增强系统可靠性。
衍生相关工作
该数据集衍生了一系列经典研究工作,主要集中在非侵入式负载监测与时间序列分析领域。例如,研究者利用其谐波特征开发了基于随机森林的分类模型,用于自动识别电力系统状态;同时,结合主成分分析等降维技术,实现了高维数据的可视化与解释。相关工作还扩展到异常检测算法,如通过聚类结果对比历史模式,以发现潜在故障。这些研究不仅验证了数据集的实用性,还推动了机器学习在能源管理中的方法创新,为后续的智能电网与物联网应用奠定了基础。
以上内容由遇见数据集搜集并总结生成



