five

卡塔尔大学数据集(QUD)

收藏
arXiv2020-09-17 更新2024-06-21 收录
下载链接:
http://em3.i-know.org/datasets/
下载链接
链接失效反馈
官方服务:
资源简介:
卡塔尔大学数据集(QUD)是由卡塔尔大学电气工程系创建的注释能耗异常检测数据集。该数据集包含多种电气设备的能耗记录,以及室内气候条件如湿度、温度、房间占用率和光照水平的数据。QUD数据集的采样间隔从3秒到30分钟不等,旨在用于测试和训练异常检测算法,从而减少能源浪费。该数据集特别适用于中东地区,通常使用240V电压。

The Qatar University Dataset (QUD) is an annotated dataset for energy consumption anomaly detection, created by the Department of Electrical Engineering at Qatar University. This dataset contains energy consumption records of various electrical equipment, alongside data on indoor climate conditions including humidity, temperature, room occupancy rate, and lighting level. The sampling interval of the QUD dataset ranges from 3 seconds to 30 minutes, and it is designed for testing and training anomaly detection algorithms to reduce energy waste. This dataset is particularly suitable for the Middle East region, where 240V voltage is commonly used.
提供机构:
卡塔尔大学电气工程系
创建时间:
2020-09-17
搜集汇总
数据集介绍
构建方式
在建筑能耗研究领域,高质量数据集的构建是推动能源效率分析的基础。卡塔尔大学数据集(QUD)的构建过程体现了多模态数据采集的前沿理念,其通过部署智能子计量模块与传感器网络,系统性地采集了电力消耗及室内环境参数。具体而言,研究团队在实验室环境中安装了电流互感器与NodeMCU等硬件,实时监测空调、照明等电器的有功功率,并同步记录温度、湿度、光照强度及人员 occupancy 等上下文信息。数据采集周期规划为一年,采样间隔灵活设置在3秒至30分钟之间,以确保既能捕捉瞬时异常又能反映长期模式。所有数据通过Raspberry Pi平台无线传输,并以JSON格式存储于CouchDB数据库,形成了兼具时间序列粒度与多维度特征的标注数据集。
特点
QUD数据集的突出特点在于其针对异常检测任务的专门化设计与丰富的上下文信息集成。作为中东地区首个公开的标注型电力消耗数据集,它首次在240V电压环境下采集了细粒度电器级能耗数据,并创新性地引入了“微时刻”标注框架。该框架依据功耗水平与用户在场状态,将每个数据点标注为“正常使用”、“开启”、“关闭”、“过度消耗”及“用户不在场时的消耗”五类,从而为监督学习算法提供了明确的训练标签。此外,数据集融合了功率、温湿度、光照与 occupancy 等多源异构数据,突破了传统数据集仅聚焦聚合能耗的局限,为理解用户行为与能耗的复杂关联提供了多维视角。
使用方法
该数据集主要服务于建筑能源管理领域的算法开发与评估,尤其在异常消耗检测、用户行为分析与能效推荐系统等方向具有重要应用价值。研究者可利用其标注信息,直接训练和测试分类模型(如决策树、支持向量机或深度学习网络)以识别“过度消耗”或“无效消耗”等异常模式。同时,多模态时间序列数据支持联合分析环境参数与能耗的因果关系,可用于构建 occupancy 预测或偏好检测模型。在实际使用中,建议将功率数据与对应的微时刻标签及环境变量同步输入,采用滑动窗口或序列建模方法提取特征;数据集也可作为基准,用于对比无监督异常检测算法在未标注数据上的性能,推动能源数据分析方法的创新。
背景与挑战
背景概述
卡塔尔大学数据集(QUD)由卡塔尔大学与德蒙福特大学的研究团队于2020年共同构建,旨在应对建筑能源效率领域的核心研究问题。该数据集聚焦于细粒度电力消耗监测与异常检测,通过采集多模态数据(包括电器级功耗、室内温湿度、光照及人员占用信息)来解析用户行为与能耗间的复杂关联。作为中东地区首个公开的标注异常检测数据集,QUD填补了该区域高电压环境下精细化能耗数据的空白,为机器学习算法在能源管理中的应用提供了关键实验基础,显著推动了智能建筑与可持续能源研究的发展。
当前挑战
QUD致力于解决建筑能耗异常检测这一领域核心挑战,其构建需克服多维度难题:在数据采集层面,需集成异构传感器实现多模态同步记录,并保障长期监测中设备稳定性与数据一致性;在标注层面,需设计基于“微时刻”范式的精细标注体系,以区分正常与异常用电模式(如过度消耗或无人占用时的能耗),这对标注逻辑的严谨性与可扩展性提出较高要求。此外,数据集需兼顾用户隐私保护与数据开放性,在提供详尽上下文信息的同时避免敏感行为泄露,这要求构建过程中平衡数据效用与伦理约束。
常用场景
经典使用场景
在建筑能源效率研究领域,卡塔尔大学数据集(QUD)作为首个针对中东地区240V电压环境的注释型功耗异常检测数据集,其经典使用场景聚焦于训练和验证异常功耗检测算法。该数据集通过采集电器级功耗数据及室内环境参数(如温度、湿度、光照和人员占用情况),为研究者提供了标注的“正常”与“异常”功耗序列,特别适用于基于微时刻分析的异常行为识别。这种精细化的数据标注机制,使得QUD成为开发监督式机器学习模型的理想测试平台,尤其在区分“过度功耗”和“无人时功耗”等异常模式方面展现出独特价值。
解决学术问题
QUD数据集主要解决了建筑能耗研究中缺乏标注数据的核心学术问题。传统功耗数据集多未标注异常类别,限制了监督式异常检测算法的发展。QUD通过引入基于微时刻的注释框架,将功耗行为分类为“正常使用”、“开启/关闭”、“过度功耗”及“无人时功耗”等类别,为算法提供了明确的训练标签。这不仅促进了异常检测模型的性能评估与比较,还推动了能耗行为可解释性研究的发展。其意义在于填补了中东地区气候与电压环境下注释数据集的空白,为跨区域能耗比较研究提供了基准数据,同时推动了以用户行为为中心的节能策略优化。
衍生相关工作
围绕QUD数据集衍生的经典研究工作主要集中在微时刻分析与智能推荐系统的结合。例如,研究者利用QUD的标注数据开发了基于深度神经网络的异常功耗分类模型,实现了对“过度功耗”等微时刻的高精度识别。进一步的工作将微时刻可视化工具与可解释推荐系统相结合,构建了用户行为反馈闭环,如“REHAB-C”移动应用通过分析QUD数据生成个性化节能建议。同时,基于生成对抗网络的数据增强方法被提出,以解决QUD中异常样本不平衡的问题。这些工作共同推动了注释型能耗数据集在行为干预、可视化分析及跨模态数据融合方向的方法创新。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务