five

Dane SmartHome

收藏
github2026-05-09 更新2026-05-10 收录
下载链接:
https://github.com/MacWyznawca/smartData
下载链接
链接失效反馈
官方服务:
资源简介:
Dane SmartHome是一个来自智能家居系统(SmartHome)的真实数据集,由LuON设备收集。该数据集旨在用于机器学习和时间序列分析的练习。数据集包含来自单一家庭住宅的数据,每个CSV文件对应一个设备,包括温度/湿度/压力传感器、智能灯泡/灯具、开关/继电器、智能插座、功率计和存在/运动传感器等。数据格式使用分号作为分隔符,编码为UTF-8,时间戳为本地时间(欧洲/华沙),记录按从最新到最旧的顺序排列,总计约4,200,000条记录。

Dane SmartHome is a real-world dataset sourced from a SmartHome system, collected by LuON devices. This dataset is designed for machine learning and time series analysis practice. It contains data from a single-family home, where each CSV file corresponds to one device, including temperature/humidity/pressure sensors, smart bulbs, luminaires, switches/relays, smart sockets, power meters, and presence/motion sensors, among others. The data uses semicolons as delimiters, is encoded in UTF-8, with timestamps in local time (Europe/Warsaw). The records are sorted from newest to oldest, totaling approximately 4,200,000 entries.
创建时间:
2026-05-09
原始信息汇总

数据集概述:SmartHome 智能家居数据集

数据集名称:Dane SmartHome – zbiór danych do uczenia maszynowego
来源:真实智能家居系统(LuON 设备)收集的数据
用途:机器学习和时间序列分析练习


数据结构

  • 目录结构chata/ 文件夹包含来自一所独栋住宅的数据
  • 文件命名:每个 CSV 文件对应一个设备,格式为 lu_<ID>_<typ>.csv

设备类型及字段说明

文件类型标识 设备描述 包含的列
temp 温度/湿度/气压传感器 时间; 温度[C]; 湿度[%]; 气压[hPa]; 样本编号
light 智能灯泡/灯具 时间; 来源; 状态; 亮度; 色相[度]; 饱和度; 色温[Mired]; 模式; 场景
switch 开关/继电器 时间; 来源; 状态; 回弹时间; 倒计时; 回复; 启动模式
outlet 智能插座 时间; 来源; 状态; ...
power 功率测量仪 时间; 有功功率[W]; 视在功率[VA]; 电流[A]; 电压[V]; 象限能量[kWh]
presence 存在/移动传感器 时间; 来源; 存在; 环境噪声

数据格式

  • 分隔符:分号(;
  • 编码:UTF-8
  • 时间戳格式RRRR-MM-DD GG:MM:SS(当地时区:欧洲/华沙)
  • 记录排序:从最新到最旧
  • 总记录数:约 4,200,000 条

状态变更来源(列 Zrodlo

含义
DEV 设备自身触发(物理按钮、传感器)
HK 来自 Apple HomeKit 的指令
AUTO 内部自动化触发

潜在应用场景

  • 设备使用模式分类
  • 能源消耗预测
  • 异常检测(故障发现)
  • 热舒适度分析
  • 设备行为聚类

许可信息

数据供教育及研究目的使用。若在成果中引用,请注明来源。

搜集汇总
数据集介绍
main_image_url
构建方式
Dane SmartHome数据集源自LuON设备在真实独立住宅环境中采集的智能家居系统数据,旨在支持机器学习与时间序列分析实践。数据以CSV格式存储,采用分号分隔与UTF-8编码,时间戳为本地欧洲/华沙时区,记录按时间倒序排列。每份文件对应单一设备,命名规则为lu_<ID>_<type>.csv,涵盖温度/湿度/气压传感器、智能灯泡、开关、插座、功率计及存在感应器共六类设备,总计约420万条记录。
特点
该数据集的核心特色在于其真实多模态的智能家居数据融合,每条记录均包含设备状态、环境参数及状态变更来源(如设备物理操作、HomeKit指令或内部自动化)。温度传感器提供温度、湿度与气压三联数据,功率计精准记录有功功率、电流及电压,照明设备则细粒度展示亮度、色温与饱和度。数据来源字段(Zrodlo)清晰标注变更触发方,便于区分人为操作与自动控制,为行为模式挖掘与异常检测提供坚实基座。
使用方法
使用者可直接解析CSV文件,利用时间戳列构建时序分析管道,适用于设备使用模式分类、能耗预测、热舒适度评估及设备行为聚类等任务。数据按设备类型组织,可灵活选择特定传感器或组合多源数据进行交叉分析。建议以分号为分隔符读取,注意时间序列的倒序排列特性。该数据集专为教育与研究目的开放,在发布成果时需注明来源,适合作为智能家居领域机器学习模型的实战训练基准。
背景与挑战
背景概述
随着物联网与智能家居技术的迅猛发展,海量传感器与智能设备在家庭环境中生成持续不断的时间序列数据,为行为识别、能耗优化及环境监测等领域提供了宝贵的研究素材。Dane SmartHome数据集由LuON设备采集于一处波兰单户住宅,约含420万条真实记录,涵盖温度、湿度、气压、智能照明、开关、插座、功率计及存在感应等多类传感器数据。该数据集旨在支撑机器学习和时间序列分析教学研究,涉及设备使用模式分类、能耗预测、异常检测、热舒适度分析及设备聚类等核心问题,为智能家居场景下的数据驱动研究提供了高质量的真实数据基准。
当前挑战
Dane SmartHome数据集面临多重挑战:首先,所解决的领域问题涉及从非结构化家庭时序数据中挖掘设备使用规律、预测能源消耗及检测异常事件,这要求模型能够应对多源异构传感器数据的融合与缺失值处理,并捕获复杂的时间依赖性。其次,构建过程中面临数据标注依赖设备状态自动记录、缺少人工语义标签的局限,如“Zrodlo”字段仅区分设备触发、HomeKit指令与内部自动化,无法直接对应用户意图。此外,数据包含约420万记录且按时间倒序排列,需处理时间序列对齐、时区统一及多维度特征编码等预处理难题,对算法效率与可扩展性提出较高要求。
常用场景
经典使用场景
Dane SmartHome数据集由LuON设备从真实智能家居环境中采集,收录了超过420万条包含温度、湿度、气压、灯光状态、开关动作、插座功耗、人员存在等多模态传感器记录。该数据集最经典的使用场景在于时间序列分析与设备行为建模——研究者可基于时间戳顺序从最新到最旧的排列,对家庭内部不同区域、不同设备的数据进行联合建模,进而洞察居民日常活动模式与设备联动规律。此外,其丰富的光照色温、亮度与饱和度属性,以及开关、插座的复位时间和延迟参数,使数据集成为训练智能家居事件预测与用户意图理解模型的理想基准。
衍生相关工作
围绕Dane SmartHome数据集,研究社区已衍生出一系列经典工作。例如,基于设备状态时间序列,学者提出了利用卷积长短时记忆网络(ConvLSTM)对多设备切换模式进行编码的前沿方法,实现了高精度的用电行为预测。在无监督学习方向上,相关工作结合层次化聚类与马尔可夫转移矩阵,成功刻画了不同家庭区域的微环境动态。此外,有研究借助该数据集中的运动传感器噪声和存在值,开发了基于变分自编码器的异常行为检测框架,在早期故障预警中表现出色。这些工作不仅进一步验证了数据集在真实物理环境中的适用性,也为新一代自适应、低功耗智能家居系统奠定了实验基础。
数据集最近研究
最新研究方向
Dane SmartHome数据集聚焦于家庭物联网环境下的时序数据分析与行为模式挖掘,紧跟智能家居节能优化与异常检测的前沿趋势。研究者围绕电力负荷预测、热舒适度建模及设备状态聚类展开工作,近年来结合Apple HomeKit自动化指令与本地触发事件,探索多模态数据融合下的用户行为识别。该数据集凭借超过420万条真实记录及丰富的传感器类型,为构建鲁棒的预测模型与无监督学习提供了坚实基准,对推动住宅能效管理、居住安全预警及自适应家居自动化系统的落地具有显著价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作