Web-Based Keystroke Dynamics Dataset
收藏arXiv2012-07-04 更新2024-06-21 收录
下载链接:
http://www.epaymentbiometrics.ensicaen.fr/
下载链接
链接失效反馈官方服务:
资源简介:
本数据集名为Web-Based Keystroke Dynamics Dataset,由卡昂大学的研究团队创建。该数据集包含83名用户在不受控制的网络环境中输入的登录和密码数据,旨在模拟真实世界的认证场景。数据收集过程中,用户在无压力的情况下自行选择登录和密码,并通过网络应用进行多次输入。此数据集的应用领域主要集中在验证基于按键动态的生物识别系统的性能,特别是在解决不同登录和密码对用户识别的影响问题上。
This dataset, named Web-Based Keystroke Dynamics Dataset, was created by a research team from the University of Caen. It contains login and password input data from 83 users collected in uncontrolled web environments, aiming to simulate real-world authentication scenarios. During the data collection process, users independently selected their own login credentials and passwords in a stress-free environment, and entered the information multiple times via web applications. The main application areas of this dataset focus on validating the performance of keystroke dynamics-based biometric systems, particularly to address the impact of different login and password pairs on user recognition.
提供机构:
卡昂大学
创建时间:
2012-07-04
搜集汇总
数据集介绍
构建方式
Web-Based Keystroke Dynamics Dataset旨在为键盘敲击动力学研究提供一个更加真实的环境。该数据集的构建方式是通过网络应用程序收集用户在多种情况下敲击键盘的数据。用户被要求输入指定的登录名和密码,同时也被允许输入自己常用的登录名和密码。数据收集过程是在不受控制的网络环境下进行的,包括不同的操作系统、键盘和浏览器等因素,以确保数据的多样性和真实性。
特点
Web-Based Keystroke Dynamics Dataset的特点在于其提供了不同用户输入的不同登录名和密码对的数据,这与以往使用相同字符串的数据集有所不同。此外,数据收集是在不受控制的网络环境下进行的,这有助于提高数据集的真实性和多样性。此外,数据集还包括了用户输入的密码的长度、复杂度和熵等信息,这为研究密码特性对识别性能的影响提供了可能。
使用方法
Web-Based Keystroke Dynamics Dataset的使用方法主要包括以下几个方面:首先,研究者可以使用数据集中的不同登录名和密码对进行实验,以评估键盘敲击动力学认证方法在不同情况下的性能。其次,研究者可以分析密码长度、复杂度和熵等信息对识别性能的影响,以优化密码选择策略。最后,研究者可以使用数据集中的不同特征进行融合,以提高认证系统的整体性能。
背景与挑战
背景概述
在键盘敲击动态生物识别技术领域,研究者们一直致力于探索如何通过分析用户的敲击习惯来识别个体。这项技术以其低成本、易于实现的特点,在多因素认证系统中占有重要地位。然而,现有的研究大多基于特定数据集,用户在这些数据集中输入固定的登录名和密码。此外,许多研究是在受控环境中进行的,使用不同的采集协议、私有数据集等,这导致研究结果可能过于乐观。为了提高键盘敲击动态性能的准确性,本研究提出了一个新的数据集,该数据集由用户在不受控的Web环境中输入既定的和自选的登录名和密码对组成。这种数据集的重要性在于,它提供了比文献中受控环境更真实的键盘敲击动态性能结果。
当前挑战
该数据集面临的主要挑战包括:1)解决领域问题:在不受控的Web环境中,用户输入的登录名和密码的多样性增加了生物识别系统的复杂性,使得识别个体变得更加困难;2)构建过程中的挑战:在不受控的环境下收集数据,需要处理各种外部因素的干扰,如操作系统、键盘类型、浏览器等,这些都可能影响敲击动态的稳定性。此外,数据集中用户数量相对较少,且男性用户占比较高,这可能会影响研究结果的普适性。为了克服这些挑战,未来的研究需要进一步探索如何利用现有的数据集,并开发新的方法来处理不受控环境中的噪声数据,以提高键盘敲击动态生物识别系统的准确性和可靠性。
常用场景
经典使用场景
该数据集主要用于生物识别技术中的键盘敲击动态研究。在经典的使用场景中,研究人员可以利用该数据集来评估和比较不同的键盘敲击动态识别算法。例如,研究人员可以比较使用用户自选的登录名和密码与使用规定的登录名和密码的识别算法的性能差异。此外,该数据集还可以用于研究键盘敲击动态识别算法在不同计算机、键盘和浏览器环境下的表现。
解决学术问题
该数据集解决了生物识别技术中键盘敲击动态识别算法在真实环境下的性能评估问题。传统的键盘敲击动态研究通常在受控环境下进行,使用规定的登录名和密码,这可能导致研究结果过于乐观。而该数据集收集了用户在真实网络环境下的键盘敲击动态样本,包括用户自选的登录名和密码,使得研究结果更加贴近实际情况。此外,该数据集还可以用于研究密码长度、复杂度和熵对键盘敲击动态识别算法性能的影响,从而为密码选择提供参考。
衍生相关工作
基于该数据集,研究人员已经开展了许多相关研究。例如,有研究利用该数据集分析了键盘敲击动态识别算法在不同特征组合下的性能,并提出了基于特征融合的算法来提高识别性能。此外,还有研究利用该数据集分析了密码长度、复杂度和熵对键盘敲击动态识别算法性能的影响,并提出了基于密码质量的认证策略。这些研究成果为键盘敲击动态识别技术的发展和应用提供了重要的理论和实践基础。
以上内容由遇见数据集搜集并总结生成



