five

DOO-RE

收藏
arXiv2024-01-17 更新2024-06-21 收录
下载链接:
http://doo-re.kaist.ac.kr/
下载链接
链接失效反馈
官方服务:
资源简介:
DOO-RE数据集是由韩国科学技术高级研究院创建的,旨在通过环境传感器数据识别会议室中的活动。该数据集包含来自声音、投影仪等多种环境传感器的数据流,每条数据流被分割成活动单元,并通过交叉验证注释过程由多个注释者提供活动标签,以提高注释质量。DOO-RE数据集最终包含9种活动,旨在支持在真实会议室中对单人和团体活动的识别。该数据集适用于开发强大的活动识别方法,特别是在智能办公室环境中,帮助用户高效执行任务。

The DOO-RE dataset was created by the Korea Advanced Institute of Science and Technology (KAIST) with the goal of recognizing activities in meeting rooms using environmental sensor data. This dataset contains data streams from various environmental sensors such as microphones and projectors. Each data stream is segmented into activity units, and activity labels are provided by multiple annotators through a cross-validation annotation process to improve annotation quality. The final DOO-RE dataset includes 9 types of activities, and is designed to support the recognition of individual and group activities in real meeting rooms. This dataset is applicable to the development of robust activity recognition methods, particularly in smart office environments, to help users efficiently perform their tasks.
提供机构:
韩国科学技术高级研究院
创建时间:
2024-01-17
搜集汇总
数据集介绍
构建方式
在物联网技术蓬勃发展的背景下,DOO-RE数据集通过部署于真实会议室中的多样化环境传感器构建而成。数据采集系统整合了环境驱动、用户驱动与执行器驱动三类传感器,包括亮度、湿度、温度、声音、运动检测、座位占用及设备开关状态等,以捕捉用户行为引发的环境变化。原始传感器数据流经过精细化处理,通过自动检测与人工校验相结合的方式,分割为以活动为单位的独立片段,并采用交叉验证标注流程,由多名标注者协同完成活动标签的分配与验证,最终形成包含696个片段、9类活动的结构化数据集。
特点
DOO-RE数据集的核心特点在于其专注于公共空间——会议室场景下的活动识别,填补了现有环境传感器数据集多局限于私人空间的空白。数据集不仅涵盖单人活动,如进食、阅读,还首次系统性地收录了小组活动,包括研讨会、技术讨论等,真实反映了多用户协同行为的复杂性。传感器配置兼顾环境状态、用户行为与设备交互的多维度信息,且所有数据均在保护用户隐私的前提下采集,避免了可识别个人特征的敏感信息,为开发实际可部署的智能服务提供了高质量、高泛化性的数据基础。
使用方法
研究者可通过数据集官方网站或Figshare仓库获取DOO-RE数据集。数据集按活动类别组织目录,每个活动片段包含元数据文件与传感器数据文件。元数据文件记录了片段的起止时间、平均参与人数及出现的传感器列表;传感器数据文件则以CSV格式存储时间戳、传感器名称与数值的三元组序列。使用时可结合机器学习方法,利用多传感器时序数据训练活动识别模型,尤其适用于探索多用户场景下的行为模式分析与实时活动识别算法验证。数据集支持基于Python的代码库进行数据提取与分析,为公共空间智能服务的研究提供了可直接利用的标准基准。
背景与挑战
背景概述
随着物联网技术的演进,利用机器学习方法识别用户活动成为提供多样化智能服务的关键途径。在此背景下,韩国科学技术院的研究团队于2023年推出了DOO-RE数据集,旨在填补公共空间中环境传感器活动识别数据的空白。该数据集聚焦于会议室场景,通过部署亮度、声音、运动等多种环境传感器,持续采集数据流,并采用交叉验证标注流程,最终标注出包括个人活动与群体活动在内的九类活动。DOO-RE的创建标志着环境传感器数据从私人空间向复杂公共空间的拓展,为构建隐私保护且可部署的智能服务提供了重要基础。
当前挑战
DOO-RE数据集致力于解决公共空间中人类活动识别这一核心问题,其挑战在于如何利用非侵入式环境传感器准确区分并识别会议室中同时发生的个人与群体活动。由于会议室缺乏明确的功能分区,且活动持续时间长、参与者动态变化,传统基于位置传感器的识别方法在此场景下面临显著局限。在构建过程中,研究团队需克服多重困难:一是设计能够捕捉环境变化、设备激活与用户动作的多样化传感器组合;二是开发高效的数据结构以应对长时间活动产生的大量数据;三是建立可靠的标注流程,通过多名标注者的交叉验证确保活动标签的一致性,以应对群体活动中语义模糊的标注难题。
常用场景
经典使用场景
在物联网与普适计算领域,环境传感器数据集对于开发非侵入式的人类活动识别模型至关重要。DOO-RE数据集作为首个专注于真实会议室场景、同时涵盖单人与群体活动的环境传感器数据集,其最经典的使用场景在于为群体活动识别研究提供基准测试平台。研究者可利用其丰富的多模态传感器时序数据(包括声音、亮度、运动、座位占用等),训练和评估机器学习与深度学习模型,以精准识别如研讨会、技术讨论、小组学习等复杂的协作性活动。该场景有效弥补了现有数据集多局限于私人空间(如智能家居)的不足,推动了公共空间活动理解研究的发展。
实际应用
在实际应用层面,DOO-RE数据集所支撑的技术可广泛应用于构建智能办公与协作空间。基于其数据训练的模型能够实现会议室使用状态的自动感知与分析,例如,自动识别会议类型(如研讨会、技术讨论)、监测参会人数变化、推断会议进程阶段,从而触发智能服务:在演讲开始时自动开启投影仪与调整灯光,在会议结束后关闭设备以节约能源。此外,此类技术也可用于办公空间利用率分析、异常行为检测(如未经授权的长时间占用),以及为远程协作提供更智能的上下文感知支持,最终提升办公效率与空间管理智能化水平。
衍生相关工作
DOO-RE数据集自发布以来,已催生了一系列围绕公共空间活动识别的创新研究。例如,AR-T研究将时序关系嵌入Transformer架构,利用DOO-RE验证了其在真实世界活动识别中的有效性。另一项工作提出了一种基于相关性的实时分割方案,专门用于处理DOO-RE中的多用户协作活动。此外,也有研究探索了基于Transformer的早期分类方法,旨在利用此类数据实现实时活动识别。这些衍生工作共同推进了复杂场景下活动识别算法在模型架构、实时处理与时序建模等方面的前沿进展,巩固了DOO-RE在该细分研究领域的基石地位。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作