SenseSeek
收藏arXiv2025-07-23 更新2025-07-23 收录
下载链接:
https://doi.org/10.1145/3749501
下载链接
链接失效反馈官方服务:
资源简介:
SenseSeek数据集由澳大利亚皇家墨尔本理工大学的研究团队创建,旨在研究用户在信息搜索过程中的行为。该数据集包含来自20名参与者的数据,包括235次模拟搜索过程试验、940个搜索过程阶段,包括信息需求、查询形成、查询提交和相关性判断等。数据集采用消费者级传感器收集生理和行为数据,包括皮肤电活动、脑电图、瞳孔、注视和运动数据。此外,还包含从传感器数据中提取的258个特征、注视标注的屏幕录制和任务响应。SenseSeek数据集是首个使用多传感器生理信号来表征信息搜索过程中多个阶段的公开数据集,旨在为研究信息搜索行为提供参考。
The SenseSeek dataset was developed by a research team from RMIT University (Royal Melbourne Institute of Technology) in Australia, with the goal of investigating user behavior during information search processes. This dataset comprises data from 20 participants, including 235 simulated information search trials and 940 search process phases covering information needs, query formulation, query submission, relevance judgment, and other related stages. Physiological and behavioral data are collected using consumer-grade sensors, including skin conductance activity, electroencephalogram (EEG), pupil metrics, gaze data, and motion data. Additionally, the dataset contains 258 features extracted from sensor data, gaze-annotated screen recordings, and task responses. As the first public dataset to utilize multi-sensor physiological signals to characterize multiple phases of the information search process, the SenseSeek dataset aims to provide a valuable reference for research on information search behavior.
提供机构:
澳大利亚皇家墨尔本理工大学(RMIT University, Australia)
创建时间:
2025-07-20
搜集汇总
数据集介绍

构建方式
SenseSeek数据集通过精心设计的实验室研究构建,旨在捕捉信息寻求行为中的多模态生理和行为信号。研究团队招募了20名参与者,在受控环境中模拟信息搜索任务,涵盖了信息需求识别(IN)、查询构建(QF)、查询提交(QS)和相关性判断(RJ)等多个阶段。数据采集使用了消费级传感器,包括脑电图(EEG)、皮肤电活动(EDA)、眼动追踪(GAZE)和运动传感器(MOTION),确保了数据的多样性和生态效度。每个搜索任务被细分为多个阶段,并通过时间戳同步多传感器数据,以提供精确的行为与生理响应关联。
特点
SenseSeek数据集的核心特点在于其多模态性和精细的搜索阶段标注。数据集包含235次试验的940个搜索阶段,覆盖了四种交互模态(如语音与文本输入)。生理数据方面,EEG信号覆盖14个通道和4个频段,EDA数据分解为皮肤电导水平和反应,眼动数据则包含瞳孔直径和凝视轨迹。此外,数据集还提供了258个提取特征、任务材料、自评感知数据及凝视标注的屏幕录像,为研究认知负荷、注意力分配等提供了丰富维度。
使用方法
该数据集适用于探索信息搜索行为中的认知机制及传感器效能评估。研究者可利用EEG和EDA数据分析不同搜索阶段的神经与生理响应差异,或通过眼动和运动数据研究行为模式。机器学习任务中,提取的特征可直接用于分类模型训练(如区分搜索阶段)。数据集采用留一交叉验证评估,并提供了基线分析代码。使用时需注意传感器数据的同步问题,建议结合时间戳对齐多模态数据,同时参考自评数据控制混淆变量。
背景与挑战
背景概述
SenseSeek数据集由RMIT大学和澳大利亚新南威尔士大学的研究团队于2025年创建,旨在通过多模态感知技术研究信息寻求行为。该数据集聚焦于用户在信息搜索过程中的复杂认知机制,通过可穿戴设备捕获生理和行为数据,包括皮肤电活动(EDA)、脑电图(EEG)、瞳孔直径(PUPIL)、注视(GAZE)和运动(MOTION)数据。数据集包含20名参与者的235次试验数据,覆盖信息需求的实现(IN)、查询制定(QF)、查询提交(QS)和相关判断(RJ)等多个搜索阶段。SenseSeek是首个利用多传感器生理信号分析信息寻求行为的数据集,为信息检索和人机交互领域提供了重要的研究基础。
当前挑战
SenseSeek数据集面临的挑战主要包括两方面:1) 领域问题挑战:信息寻求行为涉及复杂的认知过程,如何准确捕捉和区分不同搜索阶段的生理和行为信号是一个关键问题。例如,查询制定和查询提交阶段的认知负荷差异可能难以通过传感器数据明确区分。2) 构建过程挑战:数据采集过程中需同步多种传感器数据,确保时间对齐和数据质量;同时,参与者个体差异(如年龄、语言熟练度)可能影响数据一致性。此外,消费级传感器的精度限制和实验环境的控制也是构建过程中的重要挑战。
常用场景
经典使用场景
SenseSeek数据集在信息行为研究领域具有广泛的应用价值,尤其在探索信息搜索过程中的认知机制方面表现突出。该数据集通过多模态传感技术,捕捉用户在信息搜索不同阶段(如信息需求识别、查询构建、查询提交和相关性判断)的生理和行为信号,为研究者提供了丰富的实验数据。经典使用场景包括分析用户在信息搜索过程中的认知负荷变化、注意力分配模式以及情感状态波动,这些研究有助于深入理解人类信息行为的复杂性和动态性。
衍生相关工作
SenseSeek数据集已经催生了一系列相关研究和工作。基于该数据集,研究者开发了多种机器学习模型,用于分类信息搜索的不同阶段和预测用户的认知状态。此外,该数据集还启发了对新型可穿戴设备在信息交互中应用的研究,如基于脑电信号的信息需求检测和基于眼动追踪的注意力分析。一些衍生工作还探索了多模态数据融合技术,以提高对复杂信息行为的理解和预测准确性。这些研究不仅推动了信息行为理论的发展,也为实际应用系统的设计提供了新的思路和方法。
数据集最近研究
最新研究方向
近年来,SenseSeek数据集在信息行为研究领域引起了广泛关注,特别是在多模态生理信号与信息搜索行为的关联分析方面。该数据集通过整合EDA、EEG、眼动追踪和运动传感器等多源数据,为探索认知意图与交互模态对生理反应的影响提供了独特视角。前沿研究聚焦于三个方向:一是利用机器学习模型区分搜索阶段(如信息需求识别、查询提交等),其中瞳孔直径特征展现出最优分类性能;二是揭示不同交互模态(语音vs.文本输入)在脑电α/θ波段和瞳孔扩张反应的神经表征差异;三是建立生理信号与认知负荷评估的量化关系,为自适应信息检索系统开发提供理论基础。该数据集的应用直接呼应了人机交互领域对无创认知状态监测的技术需求,尤其在智能助理、教育科技等场景中展现出转化潜力。
相关研究论文
- 1SenseSeek Dataset: Multimodal Sensing to Study Information Seeking Behaviors澳大利亚皇家墨尔本理工大学, 新南威尔士大学 · 2025年
以上内容由遇见数据集搜集并总结生成



