BEACON (Behavioral Engine for Authentication & Continuous Monitoring)
收藏arXiv2026-05-15 更新2026-05-13 收录
下载链接:
https://huggingface.co/datasets/beacon-gui/BEACON-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
BEACON是由塔帕尔工程技术学院与滑铁卢大学联合创建的大规模多模态数据集,旨在通过高保真电竞环境捕获细粒度行为指纹,以推动连续身份验证与行为分析研究。该数据集包含约430GB同步模态数据,总计461GB磁盘存储,涵盖28名玩家在102.51小时《Valorant》竞技游戏中产生的超过9000万次鼠标事件、49.8万次击键事件及1.14亿个网络数据包,数据来源包括高频率硬件输入、网络抓包及屏幕录像等多维度信息。数据集通过定制化低延迟日志架构在真实游戏过程中采集,严格保障了多模态数据的时间同步性与环境上下文完整性。其核心应用领域为网络安全,特别专注于解决高认知负荷场景下连续身份验证系统的鲁棒性评估、用户行为画像构建以及多模态表征学习等关键问题。
BEACON is a large-scale multimodal dataset jointly created by Thapar Institute of Engineering and Technology and the University of Waterloo. It aims to capture fine-grained behavioral fingerprints in a high-fidelity esports environment to advance research on continuous authentication and behavioral analysis. This dataset contains approximately 430GB of synchronized multimodal data, with a total disk storage footprint of 461GB. It covers over 90 million mouse events, 498,000 keystroke events, and 114 million network packets generated by 28 players during 102.51 hours of competitive Valorant gameplay. The data is collected from multi-dimensional sources including high-frequency hardware input, network packet capture, and screen recording. The dataset is collected during actual gameplay using a customized low-latency logging architecture, which strictly ensures the temporal synchronization of multimodal data and the integrity of environmental context. Its core application domain is cybersecurity, with a particular focus on addressing key issues such as robustness evaluation of continuous authentication systems, user behavior profiling, and multimodal representation learning in high cognitive load scenarios.
提供机构:
塔帕尔工程技术学院·计算机科学与工程系; 滑铁卢大学
创建时间:
2026-05-12
搜集汇总
数据集介绍

构建方式
BEACON数据集通过定制开发的低延迟日志记录架构,在真实的《无畏契约》竞技对局中采集而成。该日志记录器作为独立可执行程序与游戏并行运行,通过四个并发线程同步捕获键盘击键事件、鼠标动态轨迹、网络数据包以及屏幕录制视频,所有模态均以主机POSIX时间戳进行统一标记,确保事后可精准对齐。采集过程中,参与者主要在受控的实验室环境中使用标准化硬件进行游戏,同时部分数据来自家庭环境以增强现实世界的多样性。最终,经过服务器端严格的结构化校验和匿名化处理,形成了包含79个会话、28名玩家的多模态数据集。
使用方法
数据集以原始日志文件形式发布,用户可访问Hugging Face平台获取CSV格式的鼠标键盘数据、PCAP格式的网络流量以及MP4格式的屏幕录像。研究者能够将数据按10至60秒的滑动时间窗口进行切分,提取论文中定义的33项工程化统计特征,用于训练和评估各类时序分类模型。论文提供了基于网站指纹识别架构的基线实验,验证了鼠标模态及多模态早期融合在28类用户识别任务中的性能。研究者亦可自行探索网络数据包与视频帧的直接融合,以构建更鲁棒的行为指纹识别系统。
背景与挑战
背景概述
在数字交互环境日益复杂的今天,传统的一次性身份认证机制已难以满足高安全性与无缝体验并重的需求,持续认证作为新兴的安全范式应运而生。BEACON(Behavioral Engine for Authentication & Continuous Monitoring)数据集由印度塔帕尔工程技术学院的研究人员于2026年创建,旨在填补高保真行为生物特征数据集领域的空白。该数据集聚焦于竞技性第一人称射击游戏Valorant中的玩家行为,通过采集79次真实游戏会话、28名不同技术水平玩家的约430GB同步多模态数据,包括鼠标动态、击键事件、网络数据包、屏幕录制及硬件元信息,为研究极端认知负荷下的连续认证、行为画像及多模态表征学习提供了严苛的测试基准。BEACON的发布为从静态入口安全向动态持续验证框架的转型奠定了关键的数据基础设施,对网络安全与行为生物特征识别领域产生了深远影响。
当前挑战
BEACON数据集所解决的领域问题核心在于,现有行为生物特征数据集多局限于低频率桌面任务或单一模态采集,缺乏在真实高风险环境下同步捕获原始传感运动输入、网络层遥测与语境视觉数据的大规模资源。构建过程中面临的挑战包括:设计不干扰游戏帧率的低延迟多模态日志架构,以精确记录微秒级交互事件;开发安全的大规模数据摄取管道,支持分块HTTPS传输与服务端严格校验;确保跨模态度量的临时对齐与匿名化处理,包括对IP地址的重映射及屏幕录制中敏感区域的遮蔽。此外,从28名参与者采集的102.51小时主动游戏数据虽实现了高密度行为建模,但样本规模限制了群体泛化性分析,且所有会话均基于Windows平台的Valorant游戏,跨平台与跨游戏的迁移能力仍是待解问题。
常用场景
经典使用场景
BEACON数据集的核心价值在于为连续身份认证研究提供了一个前所未有的高保真行为基准。在高速对抗的战术射击游戏环境中,玩家在毫秒级时间尺度上产生的鼠标轨迹、键盘敲击节奏、网络数据包流等传感器运动信号,构成了独特的个体行为指纹。该数据集最经典的用法是作为28类用户识别任务的训练与评估平台,研究者利用其同步采集的鼠标与键盘模态,在10至60秒的滑动时间窗口内提取33种细粒度统计特征,用以训练和测试各类深度学习模型对玩家身份的区分能力。
解决学术问题
该数据集直面当前行为生物特征研究领域面临的严重瓶颈——缺乏涵盖完整行为与环境遥测的综合多模态基准。以往的数据集或局限于单一模态,或采集于低风险的桌面环境,难以支撑下一代人工智能模型在真实高强度认知负荷条件下的训练与验证。BEACON的发布填补了这一空白,使得研究者能够在竞争性电子竞技的高保真场景中系统性地研究连续身份认证、行为轮廓分析、用户漂移检测以及多模态表征学习等关键学术问题,为从静态入口安全向动态连续验证框架的范式转型奠定了坚实的数据基础设施。
实际应用
在实际应用层面,BEACON数据集直接服务于下一代非侵入式、适应性身份认证系统的开发与部署。在在线游戏和电子竞技平台中,账号劫持、身份冒用和作弊行为频发,传统的密码或一次性验证码机制在延迟敏感的场景中难以为继。基于该数据集训练的行为指纹模型,能够在不打断玩家操作的前提下持续验证用户身份,为反作弊系统、账户安全保护以及高价值数字资产的防篡改监控提供核心技术支持。此外,该数据集的网络层遥测还可用于构建难以伪造的环境级验证指标,进一步提升实际部署中的安全性。
数据集最近研究
最新研究方向
BEACON数据集的最新研究方向聚焦于利用高保真电子竞技多模态数据推进连续身份认证与行为生物特征识别的前沿探索。当前,研究热点已从传统的单模态桌面行为分析转向融合鼠标动力学、键盘节律、网络数据包与屏幕录制的高频异构信号协同建模,尤其关注在极端认知负荷与微秒级操作压力下,个体运动皮层驱动产生的独特传感运动印记的鲁棒性提取。该数据集的发布直接填补了现有基准中缺乏大规模、精细对齐的实时游戏环境行为数据的空白,其提供的超过9000万条鼠标事件与1.14亿个网络数据包,为训练和验证下一代自适应防御模型、对抗性模仿攻击检测以及多模态表征学习提供了不可多得的严苛试验场。BEACON的出现标志着生物特征安全研究正从静态入口验证迈向动态、沉浸式、持续监控的新范式。
相关研究论文
- 1BEACON: A Multimodal Dataset for Learning Behavioral Fingerprints from Gameplay Data塔帕尔工程技术学院·计算机科学与工程系; 滑铁卢大学 · 2026年
以上内容由遇见数据集搜集并总结生成



