실내 데이터
收藏github2023-12-10 更新2024-05-31 收录
下载链接:
https://github.com/BanApp/SmartBuilding-BigData-Competition
下载链接
链接失效反馈官方服务:
资源简介:
基于IoT收集的室内数据,用于制作室内人员预测模型。
The dataset is collected based on IoT (Internet of Things) and is used for creating predictive models of indoor personnel.
创建时间:
2023-06-16
原始信息汇总
数据集概述
数据集名称
- 2023年智能建筑大数据分析竞赛(最优秀奖)🥇
数据集描述
- 通过IoT收集的室内数据,用于制作室内人员预测模型(CatBoost)。
数据集结果
- 最优秀奖(证书 + iPad 奖品)
- ACC Score: 0.792
文件说明
bin_classfier.pkl- 用于区分0和非0数据的二元分类模型(pickle文件)。multi_classfier.pkl- 用于区分1,2,3,4,5,6数据的多元分类模型(pickle文件)。모델_학습.ipynb- 在Colab环境中运行的二元分类模型和多元分类模型训练代码,需要GPU和catboost安装,需要设置数据集路径。모텔_테스트.ipynb- 在Colab环境中运行的代码,用于调用pickle模型和数据进行评估,需要catboost安装,需要设置数据集路径和模型路径。아이디어 요약본- 关于EDA、数据预处理和模型制作的思路摘要。아이디어 설명- 关于思路的详细说明和细节及结果记录。
模型与平台
- 平台: Google Colab
- GPU: Tesla T4
- GPU API: cuda
- 模型: CatBoost
功能描述
- 通过
모델_학습.ipynb调用训练数据(csv),进行数据预处理后训练模型。 - 通过
모델_테스트.ipynb调用评估数据(csv),进行数据预处理后使用模型。
搜集汇总
数据集介绍

构建方式
该数据集通过物联网传感器收集的实时数据构建,旨在预测室内人员数量。数据采集过程中,传感器被部署在多个室内环境中,持续监测并记录环境参数,如温度、湿度和人员流动情况。这些数据经过预处理后,用于训练和验证机器学习模型,以实现对室内人员数量的精确预测。
特点
该数据集的特点在于其高精度的时间序列数据和多样化的环境参数。数据集中不仅包含了基础的传感器读数,还通过复杂的预处理步骤,确保了数据的质量和一致性。此外,数据集还提供了二分类和多分类的模型文件,便于用户直接应用于实际场景中,进行室内人员数量的预测。
使用方法
用户可通过提供的Jupyter Notebook文件在Google Colab环境中直接运行模型训练和测试。首先,用户需设置数据集的路径,并安装必要的依赖库如CatBoost。随后,通过调用预处理的CSV文件,用户可以进行模型的训练和评估。测试阶段,用户可以利用训练好的模型对新的传感器数据进行预测,从而实现对室内人员数量的实时监控。
背景与挑战
背景概述
실내 데이터는 2023년 스마트빌딩 빅데이터 분석 경진대회에서 최우수상을 수상한 프로젝트로, IoT 센서 데이터를 활용하여 실내 재실인원을 예측하는 데 중점을 두고 있다. 이 데이터셋은 정민준 연구원이 주도적으로 개발하였으며, Google Colab 플랫폼과 Tesla T4 GPU를 활용하여 CatBoost 모델을 기반으로 구축되었다. 주요 연구 문제는 IoT 센서 데이터를 통해 실내 공간의 인원 분포를 정확히 예측하는 것으로, 이는 스마트 빌딩의 에너지 효율성 및 공간 활용 최적화에 중요한 기여를 할 수 있다. 해당 데이터셋은 스마트 빌딩 및 IoT 분야에서의 데이터 기반 의사결정을 지원하는 데 있어 중요한 역할을 하고 있다.
当前挑战
실내 데이터셋의 주요 도전 과제는 IoT 센서 데이터의 노이즈와 불완전성으로 인한 정확도 문제이다. 센서 데이터는 다양한 환경 요인에 의해 영향을 받기 쉽고, 데이터의 불균형 문제가 발생할 수 있다. 또한, 실내 공간의 복잡한 구조와 다양한 활동 패턴을 반영하기 위해 다중 분류 모델을 구축하는 과정에서 모델의 복잡성이 증가하며, 이는 계산 비용과 학습 시간의 증가로 이어질 수 있다. 데이터 전처리 단계에서도 센서 데이터의 정제와 특징 추출이 중요한 과제로 부각되며, 이를 통해 모델의 예측 성능을 극대화하는 것이 핵심이다.
常用场景
经典使用场景
실내 데이터는 IoT 센서를 통해 수집된 데이터를 기반으로 실내 재실인원을 예측하는 데 주로 사용됩니다. 이 데이터셋은 다양한 실내 환경에서의 인원 분포를 분석하고 예측 모델을 학습하는 데 적합하며, 특히 스마트 빌딩 관리 시스템에서 중요한 역할을 합니다. 이를 통해 건물 내부의 에너지 효율성을 높이고, 안전 관리를 최적화할 수 있습니다.
实际应用
실내 데이터는 스마트 빌딩 관리 시스템에서 실제로 적용될 수 있습니다. 예를 들어, 건물 내부의 에너지 소비를 최적화하거나, 재실인원에 따른 공조 시스템의 자동 조절이 가능합니다. 또한, 이 데이터셋은 보안 시스템과 통합되어 실시간으로 건물 내부의 인원 분포를 모니터링하고, 비상 상황 시 신속한 대응을 가능하게 합니다.
衍生相关工作
실내 데이터를 기반으로 한 연구는 스마트 빌딩 기술의 발전에 중요한 기여를 하고 있습니다. 특히, CatBoost 모델을 활용한 재실인원 예측 연구는 이 분야에서 주목받고 있으며, 이를 통해 다양한 실내 환경에서의 인원 분포 예측 모델이 개발되었습니다. 또한, 이 데이터셋은 에너지 효율성 및 안전 관리와 관련된 다양한 연구에 활용되고 있습니다.
以上内容由遇见数据集搜集并总结生成



