CyTrack
收藏github2026-04-09 更新2026-04-10 收录
下载链接:
https://github.com/Zy-IIN/CyTrack
下载链接
链接失效反馈官方服务:
资源简介:
CyTrack是一个用于虚拟现实(VR)中晕动症分析的高保真多模态数据集。它包含在受控VR运动场景下收集的同步生理信号和眼动追踪数据。数据集包含24名参与者的数据,每人6个会话,总时长约36小时,具有分钟级注释和多模态数据(眼动追踪、心电图、皮肤电活动、呼吸)。
CyTrack is a high-fidelity multimodal dataset for motion sickness analysis in virtual reality (VR). It contains synchronized physiological signals and eye-tracking data collected under controlled VR motion scenarios. The dataset includes data from 24 participants, with 6 sessions per participant, totaling approximately 36 hours in duration. It features minute-level annotations and multimodal data covering eye tracking, electrocardiography (ECG), electrodermal activity (EDA), and respiration.
创建时间:
2026-04-02
原始信息汇总
CyTrack 数据集概述
数据集基本信息
- 数据集名称:CyTrack: A Multimodal Dataset for Continuous Cybersickness Tracking in Virtual Reality
- 核心目标:为虚拟现实(VR)中的晕动症分析提供高保真多模态数据集。
- 数据内容:包含在受控VR运动场景下收集的同步生理信号和眼动追踪数据。
- 参与者数量:24人
- 会话次数:每人6次
- 总时长:约36小时
- 标注粒度:分钟级标注
- 模态:眼动追踪、心电图(ECG)、皮肤电活动(EDA)、呼吸
数据集设计目的
- 支持细粒度的晕动症追踪。
- 支持多模态生理建模。
- 支持跨重复暴露的纵向分析。
数据结构与字段
每条记录对应一个1分钟的时间窗口,并与主观标签对齐。
数据字段分类
| 类别 | 描述 |
|---|---|
| 元数据 | 参与者ID、会话ID、条件、时间索引 |
| 生理特征 | 心率(HR)、SDNN、RMSSD、皮肤电导水平(SCL)、皮肤电导反应幅度(SCR_AMP)、皮肤电导反应计数(SCR_COUNT) |
| 呼吸 | 呼吸率(RESP_RATE)、呼吸幅度(RESP_AMP) |
| 眼动特征 | 眨眼频率、眨眼持续时间、PERCLOS代理、追踪丢失 |
| 标签 | 分钟级晕动症评分(MISC)、会话级模拟器晕动症问卷评分(SSQ) |
| 有效性标志 | ecg_valid、eda_valid、resp_valid、eye_valid |
数据模态详情
- 心电图(ECG):提供心率和心率变异性(SDNN, RMSSD)。
- 皮肤电活动(EDA):提供皮肤电导(SCL, SCR特征)。
- 呼吸:提供呼吸频率和幅度。
- 眼动追踪:提供眨眼行为和注意力相关指标。
数据预处理流程
提供的处理特征遵循以下流程:
- 基线归一化(相对于第0分钟)
- 信号质量过滤
- 均值插补(仅训练集,留一受试者交叉验证)
- Z分数归一化
- 带掩码的序列填充
基准任务
任务1:分钟级晕动症追踪
- 输入:多模态时间序列
- 输出:MISC评分(0–8)
- 类型:回归
任务2:会话级SSQ预测
- 输入:完整会话序列
- 输出:SSQ评分
- 类型:回归
基线模型
- 线性回归(LR)
- XGBoost
- 门控循环单元(GRU)
- 序列到一维长短期记忆网络(Sequence-to-One LSTM)
- SQI感知多模态融合模型(论文提出)
代码结构
- 预处理代码:位于
/preprocessing/目录。 - 基准模型代码:位于
/benchmark/目录。 - 示例用法:
jupyter nbconvert --to script benchmark_dual_task.ipynb
数据获取方式
由于数据集规模较大(约25GB),提供以下获取途径:
- 示例数据:包含在本代码库的
/sample_data/目录中。 - 完整数据集:包含原始数据和处理后数据,托管于安全服务器。获取链接:https://gofile.me/6YCsl/TciBR8E8S,访问密码需申请获取。
- 发表后访问:论文发表后,数据集将公开可用,详细访问说明将在此页面更新。
引用格式
若使用本数据集,请引用:
@inproceedings{cytrack2026, title={CyTrack: A Multimodal Dataset for Continuous Cybersickness Tracking in Virtual Reality}, author={...}, booktitle={ACM Multimedia}, year={2026} }
许可协议
本作品采用 知识共享署名 4.0 国际许可协议 进行许可。
搜集汇总
数据集介绍

构建方式
在虚拟现实研究领域,精准追踪晕动症需要高质量的多模态数据支撑。CyTrack数据集通过精心设计的实验流程构建而成,招募了24名参与者在受控的VR运动场景下进行六次重复会话,累计采集约36小时的同步生理信号与眼动数据。数据以每分钟为时间窗口进行切分,并配以分钟级的主观晕动症评分(MISC)及会话级的模拟器晕动问卷(SSQ)标签,确保了时间序列的精细对齐。原始信号经过基线归一化、信号质量过滤及标准化等预处理步骤,最终形成了包含心电、皮肤电导、呼吸与眼动特征的结构化时序特征集合。
特点
该数据集的核心特点在于其高保真度与多模态同步性,为连续晕动症分析提供了独特价值。数据集囊括了心电信号衍生的心率变异性指标、皮肤电导反应特征、呼吸模式参数以及反映视觉疲劳与注意力的眼动指标,形成了对晕动症生理机制的全面刻画。其分钟级注释机制支持对晕动症动态变化的细粒度追踪,而纵向重复暴露的设计则便于研究适应性与耐受性的演变规律。此外,数据集提供了严格的数据有效性标志,并附带了完整的预处理代码与基准模型,极大提升了研究的可复现性与比较基准的可靠性。
使用方法
为便于研究者开展实验,数据集提供了清晰的使用路径。用户可通过访问指定链接获取完整数据集,或利用代码库中的样本数据进行初步探索。数据集支持两项核心基准任务:一是基于多模态时间序列输入,进行分钟级晕动症严重程度(MISC)的回归预测;二是利用整个会话序列预测会话后的总体SSQ得分。配套代码库包含了从数据预处理、特征提取到模型训练的全流程脚本,并提供了从线性回归、XGBoost到循环神经网络等多种基线模型的实现。研究者可以遵循留一被试交叉验证的设置,直接复现基准结果或在此基础上开发新的融合与预测算法。
背景与挑战
背景概述
虚拟现实(VR)技术的普及使得用户沉浸式体验日益丰富,然而伴随而来的晕动症(Cybersickness)问题成为制约其广泛应用的关键瓶颈。为深入探究晕动症的动态演变机制,研究团队于2026年推出了CyTrack数据集,该数据集由学术界与工业界合作构建,旨在通过高精度多模态生理信号与眼动追踪数据,实现对VR环境中晕动症的连续、细粒度监测。其核心研究问题聚焦于揭示不同VR运动场景下生理指标的时序变化规律,并建立与主观不适感之间的量化关联,为开发实时干预系统与个性化舒适度模型提供了至关重要的数据基础,显著推动了人机交互与健康信息学领域的实证研究进展。
当前挑战
在晕动症研究领域,传统方法依赖会话级主观问卷(如SSQ),难以捕捉症状的瞬时波动与个体差异,这构成了精准建模的主要障碍。CyTrack数据集构建过程中面临多重挑战:多模态数据的高精度同步采集要求严格的实验控制与设备校准,以保障心电图、皮肤电导、呼吸及眼动信号的时间对齐;分钟级主观标注(MISC)的获取需在沉浸式VR体验中实现最小干扰的实时反馈,对实验设计与参与者配合度提出了极高要求;此外,处理大规模原始生理信号时,信号质量过滤、缺失值插补以及跨模态特征融合均需设计鲁棒的预处理流程,以确保下游机器学习任务的可靠性与可复现性。
常用场景
经典使用场景
在虚拟现实(VR)技术日益普及的背景下,CyTrack数据集为研究者在精细追踪晕动症(cybersickness)方面提供了关键支持。该数据集通过同步采集眼动追踪、心电图、皮肤电导和呼吸等多模态生理信号,结合分钟级的主观标注,使得研究者能够深入分析VR运动场景下晕动症的动态演变过程。其经典使用场景包括构建时间序列模型,以预测用户在VR体验中每一分钟的晕动症强度,从而揭示生理响应与主观不适之间的复杂关联。
解决学术问题
CyTrack数据集有效解决了虚拟现实领域长期存在的晕动症量化难题。传统研究多依赖会话级的主观问卷(如SSQ),难以捕捉晕动症的瞬时波动。该数据集通过提供高时间分辨率的同步多模态数据,支持对晕动症的细粒度建模,促进了生理信号与主观感知的关联分析。这不仅深化了对晕动症发生机制的理解,也为开发实时监测与干预算法奠定了数据基础,推动了VR舒适性研究的范式转变。
衍生相关工作
围绕CyTrack数据集,已衍生出一系列经典研究工作,特别是在多模态融合与序列建模方向。例如,研究者提出了SQI-Aware Multimodal Fusion模型,创新性地结合信号质量指标以提升预测鲁棒性。同时,基于GRU、LSTM等循环神经网络的基准模型被广泛用于分钟级晕动症追踪任务。这些工作不仅验证了数据集的实用价值,也推动了时间序列分析、生理计算与VR人机交互等交叉领域的算法进步。
以上内容由遇见数据集搜集并总结生成



