GazeBaseVR

Name: GazeBaseVR
Creator: 德克萨斯州立大学
Published: 2022-10-14 13:29:03
License: 暂无描述

arXiv2022-10-14 更新2024-06-21 收录

下载链接：

https://doi.org/10.6084/m9.figshare.21308391

下载链接

链接失效反馈

官方服务：

资源简介：

GazeBaseVR是一个大规模、纵向的双目眼动追踪数据集，由德克萨斯州立大学创建。该数据集包含来自407名大学年龄参与者的5020次记录，这些记录是在26个月内通过配有眼动追踪功能的虚拟现实头盔以250Hz频率收集的。参与者进行了五种不同的眼动任务，包括调节任务、水平平滑追踪任务、视频观看任务、自我节奏阅读任务和随机斜向扫视任务。数据集适用于多种研究，特别是在虚拟现实设备中的眼动生物识别技术，因其大规模和纵向特性。此外，部分参与者在COVID-19感染前后被记录，为研究COVID-19对眼动行为的潜在长期影响提供了独特机会。

GazeBaseVR is a large-scale, longitudinal binocular eye-tracking dataset created by Texas State University. This dataset comprises 5,020 recordings from 407 college-aged participants, collected over a 26-month period using virtual reality headsets equipped with eye-tracking functionality at a sampling rate of 250 Hz. Participants completed five distinct eye-movement tasks: accommodation tasks, horizontal smooth pursuit tasks, video viewing tasks, self-paced reading tasks, and random oblique saccade tasks. This dataset supports a wide range of research, particularly eye-movement biometrics in virtual reality devices, owing to its large-scale and longitudinal characteristics. Additionally, a subset of participants was recorded both before and after contracting COVID-19, providing a unique opportunity to investigate the potential long-term impacts of COVID-19 on oculomotor behavior.

提供机构：

德克萨斯州立大学

创建时间：

2022-10-14

搜集汇总

数据集介绍

构建方式

在虚拟现实与眼动生物识别技术融合的背景下，GazeBaseVR数据集的构建体现了严谨的科学设计。该数据集通过配备眼动追踪功能的虚拟现实头戴设备采集，覆盖了407名大学年龄段的受试者，历时26个月分三轮完成数据收集。每轮记录均以250赫兹的采样频率捕获双眼水平与垂直方向运动，数据以视觉角度表示。参与者需完成五项眼动任务，包括聚散运动、水平平滑追踪、阅读、视频观看及随机扫视，以此模拟多样化的视觉行为场景。数据预处理环节采用了线性插值确保时间戳一致性，并运用Savitzky-Golay滤波器进行速度通道计算，最终将记录分割为5秒非重叠窗口，为后续分析提供结构化输入。

特点

GazeBaseVR数据集的核心特点在于其源于虚拟现实环境的眼动数据，相较于传统高精度眼动仪，该数据具有更高的噪声水平，却更贴近实际应用场景。数据集包含5020条双眼记录，不仅支持单眼分析，还提供双眼协同运动信息，扩展了生物特征识别的维度。其时间跨度涵盖短期与长期追踪，短期数据间隔约20分钟，长期数据则跨越约26个月，为研究眼动模式的时变性提供了宝贵资源。数据集中融合了多种任务类型，从基础扫视到复杂认知活动，全面捕捉个体眼动行为的独特性，为生物识别算法的鲁棒性评估奠定了坚实基础。

使用方法

GazeBaseVR数据集的应用聚焦于眼动生物识别认证领域。研究者通常采用端到端的机器学习流程，例如基于DenseNet架构的Eye Know You Too模型，从原始眼动数据中提取128维嵌入向量。使用前需对数据进行标准化预处理，包括速度计算、噪声裁剪及时间窗口分割。评估时采用交叉验证策略，将数据划分为训练集、验证集和保留集，确保模型泛化能力。性能指标涵盖等错误率、可分离指数及在特定误接受率下的误拒绝率，以全面衡量认证系统的准确性。该数据集支持单眼与双眼模式的对比研究，并可与其他眼动数据集进行横向比较，推动虚拟现实环境下生物识别技术的发展。

背景与挑战

背景概述

在生物识别技术领域，眼动生物识别（EMB）作为一种新兴的行为特征认证方式，因其独特的个体特异性和抗伪造性而备受关注。GazeBaseVR数据集由德克萨斯州立大学的Mehedi Hasan Raju、Dillon J. Lohr和Oleg V. Komogortsev等研究人员于2023年创建，旨在探索虚拟现实（VR）环境中眼动数据的生物识别潜力。该数据集通过配备眼动追踪功能的VR头显收集了407名大学年龄段参与者的5020次双眼记录，采样率为250赫兹，涵盖了聚散、平滑追踪、阅读、视频观看和随机扫视等多种眼动任务。其核心研究问题在于评估VR头显采集的眼动数据在身份认证中的有效性，并与高端眼动仪（如EyeLink 1000）的数据进行对比，从而推动眼动生物识别技术在沉浸式环境中的实际应用，为VR安全认证系统的发展提供了关键数据支持。

当前挑战

GazeBaseVR数据集所解决的领域问题是眼动生物识别在虚拟现实环境中的身份认证，其挑战在于VR头显采集的眼动数据通常存在较高的噪声水平，这可能导致空间精度和准确性的下降，进而影响生物识别性能的稳定性。与实验室标准的高端眼动仪相比，VR设备在数据质量上的差异使得直接比较变得复杂，需要采用降采样等预处理方法来确保公平评估。在构建过程中，研究人员面临数据采集的挑战，包括维持时间戳的规律性、处理超出屏幕范围的注视样本，以及通过滤波和分段技术来优化噪声数据。此外，长期数据（如26个月间隔的记录）中眼动模式可能随时间发生变化，这增加了生物识别模型在跨时段认证中的难度，要求算法具备更强的鲁棒性和适应性。

常用场景

经典使用场景

在虚拟现实与生物识别交叉领域，GazeBaseVR数据集为眼动生物识别研究提供了关键数据支撑。该数据集通过集成眼动追踪功能的VR头显，采集了407名受试者在多种任务下的双眼眼动数据，其经典应用场景在于评估基于眼动模式的生物识别认证系统在虚拟环境中的性能。研究者利用该数据集，能够深入分析眼动特征在VR设备上的采集质量、个体识别准确性以及长期稳定性，为开发高可靠性的眼动生物识别算法奠定实证基础。

解决学术问题

GazeBaseVR数据集有效解决了眼动生物识别领域中的若干核心学术问题。首先，它通过对比VR头显与高端眼动仪的数据，揭示了设备噪声对生物识别性能的影响，为优化数据采集提供了依据。其次，数据集支持对单眼与双眼眼动数据的比较研究，证实了双眼数据在降低等错误率方面的优势，推动了多模态眼动特征融合的理论发展。此外，其长期纵向数据有助于探究眼动生物特征的时变性，为构建适应时间变化的动态认证模型提供了关键见解。

衍生相关工作

围绕GazeBaseVR数据集，已衍生出一系列经典研究工作。例如，研究团队基于该数据集开发了Eye Know You Too（EKYT）网络架构，这是一种端到端的深度学习模型，专门用于从眼动数据中提取生物识别嵌入特征。此外，相关研究还探索了眼动信号在不同频率下的身份信息含量，以及利用眼动数据进行活体检测以抵御虹膜打印攻击。这些工作不仅验证了VR眼动数据的生物识别潜力，也推动了机器学习方法在眼动分析中的应用，为后续研究提供了重要的算法基准与理论框架。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集