BB-MAS
收藏arXiv2019-12-20 更新2024-06-21 收录
下载链接:
http://dx.doi.org/10.21227/rpaz-0h66
下载链接
链接失效反馈官方服务:
资源简介:
BB-MAS数据集是由锡拉丘兹大学创建,包含117名参与者在桌面、平板和手机上进行的打字、步态和滑动等活动的数据。数据集总计包含约350万次按键事件、5710万次加速度计和陀螺仪数据点、170万次滑动数据点。创建过程涉及从2017年4月至6月收集数据,并通过IRB批准。该数据集旨在解决多设备、多活动和多模式数据从同一参与者中获取的问题,适用于行为生物识别技术的研究。
The BB-MAS dataset was developed by Syracuse University. It contains data collected from 117 participants who performed typing, gait, and sliding activities on desktop computers, tablets, and mobile phones. In total, the dataset includes approximately 3.5 million keystroke events, 57.1 million accelerometer and gyroscope data points, and 1.7 million sliding interaction data points. Data was collected between April and June 2017, and the study received approval from the Institutional Review Board (IRB). This dataset aims to address the challenge of acquiring multi-device, multi-activity, and multi-modal data from the same participant, and is applicable to research in behavioral biometrics.
提供机构:
锡拉丘兹大学
创建时间:
2019-11-08
搜集汇总
数据集介绍

构建方式
在行为生物识别领域,多设备多活动数据的稀缺性长期制约着跨设备连续认证研究的发展。BB-MAS数据集的构建旨在填补这一空白,通过精心设计的实验协议,采集了117名参与者在桌面电脑、平板电脑和手机三种设备上执行打字、步态和滑动活动的数据。数据收集过程历时约三个月,每位参与者平均花费2至2.5小时完成一系列顺序任务,包括固定文本与自由文本的输入、平坦走廊行走、上下楼梯以及触摸屏滑动操作。所有设备均配备了相应的传感器记录器,确保了击键事件、加速度计、陀螺仪和触摸数据的同步采集与高精度时间戳记录,最终形成了包含约350万次击键事件、各5700万数据点的加速度计与陀螺仪数据以及170万次滑动数据点的大规模多模态数据集。
使用方法
研究人员可通过IEEE Dataport公开获取BB-MAS数据集,其数据以CSV格式组织,便于直接导入分析工具。使用该数据集时,首先可依据设备类型(桌面、平板、手机)和活动类别(打字、步态、滑动)对原始数据进行分割,利用提供的检查点文件对步态活动进行子阶段划分。对于特征工程,数据集已包含从原始信号中提取的常用特征集,如击键的按键保持时间和飞行时间、步态信号的均值与频域特征、滑动速度与压力统计量等,可直接用于模型训练。在跨设备行为分析中,可通过对比同一用户在不同设备上同一活动的特征分布,探索生物识别模式的迁移性与独特性。此外,结合人口统计学信息,可进一步研究行为特征与年龄、身高等属性的潜在关联,推动个性化认证模型的发展。
背景与挑战
背景概述
行为生物识别技术作为连续主动身份验证研究的关键组成部分,其发展依赖于高质量多模态数据集的支撑。BB-MAS数据集由雪城大学、佛罗里达国际大学等机构的研究团队于2017年4月至6月间构建,旨在填补多设备、多活动行为数据集的空白。该数据集采集了117名参与者在台式机、平板电脑和手机三种设备上的打字、步态及滑动触摸行为数据,涵盖了约350万次击键事件、1.14亿个加速度计与陀螺仪数据点以及170万次滑动记录。其核心研究问题聚焦于探索同一用户在不同设备间行为模式的关联性与差异性,为跨设备身份验证与行为分析提供了前所未有的实证基础,显著推动了行为生物识别领域向真实多设备场景的演进。
当前挑战
BB-MAS数据集所应对的领域挑战在于解决多设备环境下连续身份验证的行为模式泛化问题。传统行为生物识别研究多局限于单一设备或单一活动,难以刻画用户在不同交互场景中的行为一致性,而该数据集通过同步采集多设备多模态数据,为跨设备行为建模与身份迁移学习提供了关键支撑。在构建过程中,研究团队面临设备同步、数据标准化与隐私保护等多重挑战:需确保四类设备(台式机、手持平板、手持手机及口袋手机)的时间戳毫秒级同步;需统一不同设备记录的异构数据格式(如击键字符编码与时间表示);还需在自由文本采集中规避个人身份信息泄露,并通过现场监查修正行为标记误差,以保障数据质量与合规性。
常用场景
经典使用场景
在行为生物特征识别领域,BB-MAS数据集为跨设备连续身份验证研究提供了关键支持。该数据集通过记录同一用户在台式机、平板电脑和手机上的打字、步态和滑动行为,构建了多模态行为特征的全景视图。其经典应用场景在于探索用户在不同设备间行为模式的一致性,为构建跨设备身份验证模型提供了前所未有的数据基础。研究人员可借助该数据集分析行为特征的设备间迁移规律,验证行为生物特征在异构设备环境中的稳定性与可靠性。
解决学术问题
BB-MAS数据集有效解决了行为生物特征识别领域长期存在的关键学术问题。传统研究多局限于单一设备或单一行为模态,难以反映真实场景中用户跨设备行为模式的关联性。该数据集通过提供同一用户在三种设备上的多模态行为数据,使研究者能够深入探究跨设备行为特征的可迁移性、设备间行为差异的量化规律以及多模态特征融合的优化方法。这为构建普适性更强的连续身份验证系统奠定了数据基础,推动了行为生物特征识别从单设备场景向跨设备场景的理论拓展。
实际应用
在实际应用层面,BB-MAS数据集为智能设备安全认证系统的开发提供了重要参考。基于该数据集训练的行为识别模型可应用于金融支付设备安全验证、企业多终端办公系统无缝认证、移动医疗设备用户身份持续监控等场景。例如,通过分析用户在手机和平板上的打字节奏与滑动特征,系统可在设备切换时实现无感知身份确认。该数据集还能为个性化人机交互设计提供依据,通过识别不同设备上的行为习惯差异,优化触控界面响应参数与键盘布局适配策略。
数据集最近研究
最新研究方向
在行为生物识别领域,BB-MAS数据集为跨设备与跨模态研究开辟了前沿方向。该数据集整合了同一用户在桌面、平板和手机上的打字、步态与滑动行为,为探索设备间行为模式关联提供了独特资源。当前研究热点聚焦于利用深度学习模型分析跨设备行为一致性,例如通过卷积神经网络提取时序特征,以验证用户在不同设备上打字习惯的稳定性。同时,结合多模态融合技术,研究者正尝试将步态加速度计数据与滑动轨迹特征相结合,构建更鲁棒的连续身份认证系统。这些进展不仅推动了行为生物识别在物联网安全中的应用,也为个性化人机交互设计提供了数据支撑,具有重要的学术与实践意义。
相关研究论文
- 1Insights from BB-MAS -- A Large Dataset for Typing, Gait and Swipes of the Same Person on Desktop, Tablet and Phone锡拉丘兹大学 · 2019年
以上内容由遇见数据集搜集并总结生成



