Smart Campus dataset
收藏arXiv2023-04-26 更新2024-06-21 收录
下载链接:
https://dx.doi.org/10.21227/xe4q-ax22
下载链接
链接失效反馈官方服务:
资源简介:
Smart Campus数据集是由奥卢大学无线通信中心创建,专注于工业-学术合作、网络构建、基于研究的校园发展和试点新型智能校园服务。该数据集包含部署在奥卢大学校园内的数百个传感器数据,使用LoRa技术传输传感器读数至服务器。数据集可用于多种应用,如时间序列预测、异常检测、空间相关性和特定空间的占用估计。创建过程中,数据集处理了由于传输中断或碰撞导致的包丢失问题,确保了数据分析的稳健性。该数据集的应用领域包括智能空气通风系统的优化和室内人数监控,特别是在疫情期间,有助于控制室内人数以限制病毒传播。
The Smart Campus Dataset was developed by the Wireless Communications Center of the University of Oulu, focusing on industry-academia collaboration, network construction, research-driven campus development and piloting novel smart campus services. This dataset includes sensor data collected from hundreds of sensors deployed on the University of Oulu campus, where LoRa technology is used to transmit sensor readings to servers. It can be applied to various tasks such as time series forecasting, anomaly detection, spatial correlation analysis and occupancy estimation for specific spaces. During its creation, the dataset addressed packet loss issues caused by transmission interruptions or collisions, ensuring the robustness of data analysis. Its application fields include optimization of smart air ventilation systems and indoor occupancy monitoring, which was particularly helpful during the COVID-19 pandemic to control indoor occupancy and limit virus transmission.
提供机构:
奥卢大学无线通信中心
创建时间:
2023-04-26
搜集汇总
数据集介绍

构建方式
该数据集基于LoRaWAN技术构建,部署于芬兰奥卢大学校园及植物园,覆盖约135,000平方米的区域。网络由462个低功耗传感器设备、一个网关及服务器组成,采用星型拓扑结构。设备每15分钟采集一次数据并通过LoRa无线技术传输至网关,最终汇集至服务器。数据集包含两类子数据:LoRa参数数据集(记录信道、信噪比、信号强度等物理层特征)与传感器读数数据集(涵盖CO₂、温度、湿度、光照、声音、气压、土壤湿度及电池电量等环境参数)。传感器分为CO₂设备(326个)、声音设备(119个)和湿度设备(17个),所有设备均监测温湿度与电池状态。
特点
该数据集具备多维性与时空关联性,支持丰富的研究应用。其显著特点包括:第一,数据规模庞大,覆盖462个设备在2020年2月至2021年6月期间的连续观测,时间分辨率高(每15分钟一次);第二,融合了LoRa物理层参数(如RSSI、SNR、帧计数器)与多种环境读数,可分析传输质量与物理量的交互关系;第三,数据天然存在缺失值(因传输冲突或中断),为缺失值处理、时间序列预测及异常检测提供了真实场景;第四,传感器部署兼顾室内(教室、会议室)与室外(花园),支持空间相关性分析与环境对比研究。
使用方法
数据集可直接用于多种物联网数据分析任务。使用时需先进行预处理:通过帧计数器或时间间隔检测缺失传输,并采用K近邻(K=13优化)、线性插值等方法填充缺失值。随后可构建长短期记忆网络(LSTM)进行未来读数预测(如CO₂浓度),或搭建深度神经网络(DNN)实现房间内人数估计(论文中达到95%分类准确率)。此外,数据集还适用于时间序列预测、异常检测、空间相关性分析、电池能耗及传输失败分析等场景。所有数据与分析代码均公开,便于复现与扩展研究。
背景与挑战
背景概述
物联网技术的蓬勃发展为智慧校园的构建提供了坚实的技术支撑,其中LoRaWAN作为低功耗广域网领域的关键技术,凭借其远距离传输、低功耗与低成本的优势,成为连接大规模校园物联网设备的理想选择。在此背景下,由芬兰奥卢大学Eslam Eldeeb与Hirley Alves等人于2023年创建的Smart Campus数据集应运而生。该数据集基于LoRaWAN网络,在奥卢大学校园内135,000平方米的范围内部署了462个传感器,涵盖二氧化碳、温度、湿度、声音与光照等多种环境参数,旨在推动产研协作、网络搭建与智慧校园服务的创新。该数据集的开放共享为时间序列预测、异常检测、空间关联分析及室内人员计数等研究提供了宝贵的实验基础,对智慧校园与物联网应用领域产生了深远影响。
当前挑战
该数据集面临的核心挑战源于LoRa网络在大规模部署中固有的数据缺失问题。由于传输中断或碰撞导致的数据包丢失,会造成传感器读数不完整,进而影响后续数据分析的准确性与鲁棒性。具体而言,缺失值会降低分析效率、增加处理复杂度,并可能使结果产生偏差。此外,在构建过程中,如何从462个异构传感器中有效识别并处理缺失数据,同时平衡不同设备类型(如二氧化碳传感器、声音传感器与湿度传感器)的多维特征,亦是一大难题。针对人员计数这一典型应用,还需克服数据类别不平衡问题,以保障模型在预测室内人数时达到95%的准确率,这对数据预处理与模型设计提出了严苛要求。
常用场景
经典使用场景
Smart Campus dataset 基于 LoRaWAN 技术,汇聚了部署于奥卢大学校园内数百个低功耗传感器的多模态数据,涵盖 CO₂、温度、湿度、光照、声音、气压及土壤湿度等环境参数。该数据集最经典的使用场景之一是室内人数估计,通过分析 CO₂ 浓度等环境指标的动态变化,构建深度神经网络模型,实现非侵入式、高精度的室内人员计数。这一应用不仅验证了 LoRaWAN 在智慧校园中的可行性,也为后疫情时代空间 occupancy 监测提供了高效、低成本的解决方案。
实际应用
在实际部署中,Smart Campus dataset 助力智慧校园实现智能通风系统与空间资源优化管理。通过实时监测教室内的 CO₂ 浓度与人员密度,系统可自动调节新风量,保障室内空气质量并降低能耗。此外,该数据集还支持异常行为检测(如突发噪声或光照骤变)、设备电池寿命预测以及 LoRa 网络链路质量评估,为校园设施的精细化运维与节能降碳提供了数据驱动的决策依据。
衍生相关工作
基于该数据集,衍生出一系列经典研究工作,包括:利用 K 近邻优化缺失值填补策略,通过 LSTM 进行多步时间序列预测,以及构建深度神经网络实现 95% 准确率的人员计数分类模型。这些工作为后续研究提供了可复现的基准框架,并催生了针对 LoRaWAN 传输失败模式分析、多传感器空间相关性挖掘以及基于边缘计算的实时人数估计等方向的新探索,推动了智慧校园数据科学领域的持续发展。
以上内容由遇见数据集搜集并总结生成



