five

GazeBase

收藏
arXiv2022-03-03 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2104.10489v2
下载链接
链接失效反馈
官方服务:
资源简介:
GazeBase是一个纵向数据集,用于评估眼动认证的新型神经网络,支持多相似度损失训练,能够直接实现样本外用户的注册和认证。

GazeBase is a longitudinal dataset intended for evaluating novel neural networks for eye movement authentication. It supports multi-similarity loss training and enables direct registration and authentication for out-of-sample users.
创建时间:
2021-04-21
搜集汇总
数据集介绍
main_image_url
构建方式
在眼动生物识别研究领域,构建具有长期时间跨度的数据集对于评估生物特征的持久性至关重要。GazeBase数据集的构建采用了纵向研究设计,通过EyeLink 1000眼动仪以1000 Hz采样率单眼(左眼)记录了322名大学年龄参与者的眼动数据。数据采集历时37个月,共进行了九轮记录,每轮包含两次间隔约30分钟的会话,参与者需完成七项眼动任务,包括水平扫视、视频观看、注视、随机扫视、阅读、互动游戏等,以此捕捉不同认知负荷下的眼动模式。为确保数据的代表性与平衡性,数据集通过优先级队列算法将参与者划分为训练、验证和测试集,其中测试集独立保留,专门用于模型性能的最终评估。
特点
GazeBase数据集的核心特点在于其长期性与多任务性,为眼动生物识别研究提供了前所未有的深度与广度。数据集覆盖长达37个月的时间跨度,能够有效支持模板老化效应的分析,这是评估生物特征持久性的关键。同时,数据集包含七种不同的眼动任务,涵盖了从低认知负荷(如水平扫视)到高认知负荷(如阅读)的多种情境,使得研究能够全面考察任务类型对识别性能的影响。此外,数据集提供了从1000 Hz到31.25 Hz的多级降采样版本,便于研究不同采样率下的识别鲁棒性,模拟实际设备中可能遇到的信号质量变化。这些特点共同使GazeBase成为一个具有高度综合性与实用性的基准数据集。
使用方法
GazeBase数据集在眼动生物识别研究中主要用于模型训练、验证与测试。研究通常采用端到端的深度学习框架,如指数扩张卷积神经网络,直接从预处理后的眼动速度信号中学习嵌入表示。预处理步骤包括计算速度、裁剪异常值以及应用慢速与快速速度变换,以增强信号特征。模型训练采用度量学习方法,如多相似性损失,通过构建包含正负样本对的小批量数据来优化嵌入空间。在评估阶段,通过计算注册样本与验证样本之间时间对齐子序列嵌入的平均余弦相似度来进行身份认证。数据集的标准划分支持交叉验证,并设有独立的测试集用于最终性能评估,确保结果的可靠性与泛化能力。
背景与挑战
背景概述
GazeBase数据集由德克萨斯州立大学的研究团队于2020年创建,旨在解决眼动生物识别领域长期存在的关键问题,即眼动特征的持久性与模板老化效应。该数据集通过长达37个月的纵向追踪,记录了322名参与者在多种认知任务下的高精度眼动信号,为评估生物识别系统的长期稳定性提供了前所未有的实证基础。其核心研究在于探索眼动作为生物特征模态的可靠性与泛化能力,对推动眼动生物识别从实验室走向实际应用具有里程碑意义,已成为该领域重要的基准数据集之一。
当前挑战
GazeBase数据集致力于解决眼动生物识别中的两大核心挑战:一是眼动特征的持久性问题,即如何克服因时间推移导致的模板老化,确保认证系统在长期间隔后仍保持高精度;二是构建过程中的技术难题,包括在长达37个月的周期内维持数据采集的一致性、处理高噪声与缺失值,以及设计能够兼容多种认知任务与低采样率信号的鲁棒模型。这些挑战共同推动了眼动生物识别向更实用、更稳定的方向发展。
常用场景
经典使用场景
在眼动生物识别领域,GazeBase数据集因其纵向采集特性而成为评估模板老化效应的经典基准。该数据集包含322名参与者在37个月内多达18次的眼动记录,覆盖阅读、跳跃点追踪、视频观看及互动游戏等多种任务。研究者通常利用该数据集训练端到端的深度学习模型,如指数扩张卷积神经网络,以探究眼动特征的长期稳定性。通过多相似性损失函数,模型能够学习有意义的嵌入表示,进而支持开放集用户注册与认证。这一使用场景不仅验证了模型在长时间间隔下的认证性能,还深入分析了不同认知负荷任务及采样率对识别准确率的影响。
衍生相关工作
GazeBase数据集衍生了一系列眼动生物识别的经典研究工作。基于其多任务设计,研究者开发了DeepEyedentificationLive等模型,专注于微眼动特征提取与活体检测。数据集的纵向特性催生了针对模板老化的统计分析方法,如Friedman等人提出的特征持久性评估框架。此外,该数据集支持了度量学习在眼动识别中的创新应用,例如使用三元组损失或Wasserstein距离的深度分布嵌入方法。这些工作不仅推动了算法性能的提升,还促进了眼动生物识别标准化评估范式的建立,为后续研究提供了重要参考。
数据集最近研究
最新研究方向
在眼动生物识别领域,GazeBase数据集作为一项重要的纵向资源,正推动着前沿研究向更贴近实际应用场景的方向发展。近期研究聚焦于利用度量学习框架,特别是结合指数扩张卷积神经网络与多相似性损失函数,实现端到端的生物特征认证。这一方向突破了传统封闭集分类的局限,支持新用户的动态注册与验证,显著提升了系统的可扩展性。同时,研究深入探讨了模板老化效应,证实了眼动特征在长达37个月的时间跨度内仍保持较高的稳定性,为生物识别的长期可靠性提供了实证依据。此外,针对低认知负荷任务与低采样率环境的性能评估成为热点,研究表明即使在跳跃点任务等低负荷条件下,以及采样率降至31.25Hz时,系统仍能维持合理的认证精度,这为眼动技术在嵌入式设备与虚拟现实等资源受限场景中的部署奠定了理论基础。这些进展不仅深化了对眼动生物特征本质的理解,也为其在连续认证、活体检测等安全关键领域的商业化应用开辟了新的路径。
相关研究论文
  • 1
    Eye Know You: Metric Learning for End-to-end Biometric Authentication Using Eye Movements from a Longitudinal Dataset · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作