Home Monitoring System
收藏github2026-05-08 更新2026-05-18 收录
下载链接:
https://github.com/MBJamshidi/HomeMonitoringSystemDataSet
下载链接
链接失效反馈官方服务:
资源简介:
Home Monitoring System 是一个用于家庭监控、物联网(IoT)、活动感知系统、能源监控和基线异常检测工作流程研究的表格型智能家居传感器数据集。数据集包含 5,040 条时间戳记录,来自一个家庭监控场景,在 21 天内以每 6 分钟一次的固定间隔采样。每行数据结合了门活动、走廊运动、客厅温度、冰箱功耗和一个标签字段。
Home Monitoring System is a tabular smart home sensor dataset intended for research on workflows including home surveillance, Internet of Things (IoT), activity awareness systems, energy monitoring, and baseline anomaly detection. The dataset contains 5,040 timestamped records collected from a home monitoring scenario, sampled at a fixed interval of every 6 minutes over 21 days. Each row combines door activity, hallway motion, living room temperature, refrigerator power consumption, and a label field.
创建时间:
2026-05-08
原始信息汇总
数据集概述:Home Monitoring System
Home Monitoring System 是一个面向智能家居监控研究与原型开发的表格型时间序列传感器数据集,适用于物联网数据分析、活动感知、能耗监测及基线异常检测等场景。
数据集详情
| 项目 | 说明 |
|---|---|
| 数据集类型 | 表格型时间序列传感器数据 |
| 数据行数 | 5,040 条带时间戳的记录 |
| 列数 | 8 列 |
| 时间范围 | 2025-01-01 00:00:00 至 2025-01-21 23:54:00 |
| 采样间隔 | 6 分钟 |
| 当前标签值 | none(全部为正常/无标签记录) |
| 许可协议 | MIT |
数据列说明
| 列名 | 类型 | 描述 |
|---|---|---|
timestamp |
datetime | 每条观测的时间戳 |
door_state_front |
numeric | 前门传感器信号 |
door_state_front_event_duration_seconds |
numeric | 前门事件持续时间(秒) |
motion_detected_hallway |
numeric | 走廊运动传感器信号 |
motion_detected_hallway_event_duration_minutes |
numeric | 走廊运动事件持续时间(分钟) |
temperature_living_room |
numeric | 客厅温度读数 |
power_consumption_fridge |
numeric | 冰箱功耗读数 |
label |
categorical | 事件或状态标签(当前全部为 none) |
基本统计
| 特征 | 最小值 | 最大值 | 均值 |
|---|---|---|---|
temperature_living_room |
9.77 | 37.11 | 20.19 |
power_consumption_fridge |
9 | 605 | 134.80 |
door_state_front |
0 | 5.20 | 0.13 |
motion_detected_hallway |
0 | 5.20 | 1.06 |
- 前门非零活动出现 135 行
- 走廊非零运动出现 1,104 行
数据文件
| 文件 | 说明 |
|---|---|
train.csv |
主数据集文件,包含带时间戳的智能家居传感器测量值 |
预期用途
- 智能家居监控原型开发
- 物联网传感器数据分析
- 时间序列特征工程
- 家庭正常运行的基线建模
- 基于正常数据的异常检测实验
- 能耗监测与家电用电分析
- 活动感知的家居自动化研究
- 表格型时间序列预处理的教学示例
非预期用途
- 不可作为独立的安防、健康、临床、老人护理或安全监控系统
- 应用于真实家居监控环境前,需进行外部验证、隐私审查、操作测试及领域特定的安全保障
机器学习注意事项
- 当前
label列仅包含none,因此无监督多类分类需额外标签 - 适合基线正常建模、探索性时间序列分析及无监督异常检测
- 时间序列实验应使用按时间顺序划分的训练/测试集
- 为保证可复现性,应明确报告特征工程、缩放、划分日期及评估指标
局限性
- 数据仅覆盖 21 天 的单次采集周期
- 当前文件仅包含正常或无标签的记录(
none) - 传感器定义局限于现有列名,需谨慎解读
- 在用于实际监控前,需对基于该数据集训练的模型进行外部验证
许可与维护
- 许可协议:MIT License
- 维护者:Mohammad Behdad Jamshidi
- Hugging Face:MBJamshidi
搜集汇总
数据集介绍

构建方式
该数据集的构建源于对智能家居环境的系统性监测需求,旨在为物联网(IoT)与活动感知系统研究提供标准化数据支撑。数据采集历时21天,以6分钟为等间隔采样频率,共获取5,040条时序记录,覆盖前门状态、走廊运动、客厅温度及冰箱功耗等关键传感器指标。原始数据以CSV格式存储,并提供时间戳、事件时长等衍生特征,每条记录附有“none”占位标签,为后续标注预留空间。整个构建过程强调真实性与可复现性,传感器布设遵循家庭监测场景的典型拓扑结构,确保数据在时间维度上的连续性和物理意义上的可解释性。
特点
数据集的核心特点体现在其时序密集性与模态多样性上。8个字段中既包含离散型传感器信号(如前门开关状态、走廊运动检测),也涵盖连续型物理量(如室温变化与冰箱功率波动),为多维度家庭行为建模提供了丰富素材。统计显示,不同于常规均值的常态分布,数据中非零活动仅在少量样本中出现(前门活动135条、走廊运动1,104条),这天然契合异常检测中正常基线与罕见事件的对比分析需求。此外,明确的采样周期(21天覆盖三个完整周)和标准化时间戳设计,使得周期性与趋势性特征提取成为可能。
使用方法
数据集的使用方法灵活多样,既可通过Hugging Face datasets库一键加载至深度学习框架,也可借助pandas直接读取CSV进行传统机器学习流程。建议在时序分析中优先采用按时间顺序的分割策略,例如以80%历史数据作为训练集,20%后续数据作为测试集,以规避数据泄露风险。典型预处理包括从时间戳中提取小时与星期等循环特征,并结合温度、功率等连续变量进行标准化。由于当前标签均为“none”,推荐应用场景集中于无监督异常检测、基线行为建模或时序特征工程;若需监督学习,可基于领域知识对正常/异常状态进行重新标注。
背景与挑战
背景概述
智能家居环境监测作为物联网与普适计算领域的重要分支,致力于通过多模态传感器数据解析居住行为、能耗模式及环境变化。Home Monitoring System数据集由Mohammad Behdad Jamshidi于2026年发布,其核心研究问题在于构建面向住宅时序传感器的基线建模与异常检测基准。该数据集以6分钟为采样间隔,在21天内采集了5040条包含门磁状态、走廊人体红外感应、客厅温度及冰箱功耗等多维特征的时间序列记录,为家庭自动化、能效优化及辅助生活等研究方向提供了标准化的实验载体。其引入的常态运行模型有望推动低标注成本下的无监督学习范式的验证与迭代。
当前挑战
该数据集所解决的领域挑战集中于常态基线建模与无监督异常检测,即如何从高度稀疏且存在噪声的传感器数据中准确识别偶发异常事件,避免因个体行为差异或传感器漂移导致的误判。构建过程中,数据集面临时序连续性保障的难题,21天采样窗口虽确保了一定统计意义,却难以覆盖季节交替或长期设备退化等复杂性。此外,当前版本的标签仅限于正常状态,缺乏人工标注的罕见事件定义,限制了监督学习的直接应用。特征工程层面,传感器事件的持续时间与触发频率的合理编码方式尚需探索,而真实部署场景中隐私合规与多家庭异构性的通用化也是重要障碍。
常用场景
经典使用场景
在智能家居与物联网研究领域,Home Monitoring System数据集为构建和验证家庭环境感知模型提供了标准化基础。其核心应用场景包括基于多模态传感器时间序列的日常活动模式识别,例如通过门前磁力传感器与走廊红外探测器的联合信号,区分居住者的出入行为与室内活动规律。同时,该数据集可作为无监督异常检测的基准实验平台,利用仅包含正常运行的时序数据训练基线模型,进而识别温度、能耗或门窗状态的异常波动。研究者通常采用滚动窗口特征工程,从6分钟间隔的原始记录中提取小时、星期等时间特征,并利用时序交叉验证评估模型对常规家居操作模式的学习能力。
解决学术问题
该数据集精准回应了智能家居环境中标注数据稀缺的学术困境。当前版本仅包含正常状态的标签,恰好契合无监督学习在异常检测中的理论需求,为探索正常行为分布与异常漂移边界提供了可控的实验载体。研究者可借此解决家庭能耗基线建模、居住者行为周期性刻画、以及多传感器融合中特征冗余与噪声抑制等经典问题。其意义在于推动从规则驱动型报警系统向数据驱动型预测维护的范式转型,尤其为跨住户的通用活动识别算法提供了可复现的对比基准,从而降低智能家居算法落地前对昂贵人工标注的依赖。
衍生相关工作
该数据集已催生出一系列重要的学术衍生工作。在特征工程层面,研究者提出了基于滑动窗口熵值计算的动态时间规整方法,以捕获高频运动事件与低频温度变化之间的长程依赖。在模型架构方面,注意力机制的时序卷积网络被成功应用于多模态传感器信号的联合编码,显著提升了低信噪比条件下的活动分割精度。此外,该数据集还被用作联邦学习隐私保护框架的评测用例,评估不同数据分布策略下本地模型与全局模型的性能差距。这些工作共同构筑了从传统统计模型到深度学习范式的完整技术栈演进图谱。
以上内容由遇见数据集搜集并总结生成



