MAYA
收藏arXiv2025-04-23 更新2025-04-25 收录
下载链接:
https://github.com/williamcorrias/MAYA-PasswordBenchmarking
下载链接
链接失效反馈官方服务:
资源简介:
MAYA是一个统一、可定制的密码基准测试框架,由罗马大学的研究团队开发。该框架提供了一套标准化的评估方法,用于评估生成型密码猜测模型。MAYA包含了六个最先进的生成型密码猜测模型,八个真实世界的密码数据集,以及一系列全面的评估场景。这些数据集用于训练和测试,以回答七个关键的研究问题。MAYA旨在促进进一步的密码研究,为社区提供一个可靠、一致地评估密码生成技术的新工具。
MAYA is a unified and customizable password benchmarking framework developed by the research team at Sapienza University of Rome. This framework provides a standardized evaluation methodology for generative password guessing models. MAYA integrates six state-of-the-art generative password guessing models, eight real-world password datasets, and a comprehensive set of evaluation scenarios. These datasets are used for training and testing to address seven key research questions. MAYA aims to advance further password research and provide the community with a reliable and consistent new tool for evaluating password generation technologies.
提供机构:
罗马大学
创建时间:
2025-04-23
搜集汇总
数据集介绍

构建方式
MAYA数据集构建采用了一种标准化、可定制化的密码基准测试框架,旨在解决生成式密码猜测模型评估中的不一致性问题。该框架通过整合八个真实世界的泄露密码数据集,并采用统一的数据预处理流程(包括UTF-8编码处理、非ASCII字符过滤、训练集与测试集的80%-20%划分及去重),确保了评估环境的公平性。此外,MAYA集成了六种最先进的生成模型(如FLA、PassGAN、PassGPT等),通过超过15,000小时的计算量,在多种高级测试场景下进行系统性评估。
特点
MAYA的核心特点在于其模块化设计和全面性。首先,它覆盖了地理、语言、文化背景各异的八大数据集(如RockYou、LinkedIn、Taobao等),囊括了从社交网络到电子商务的多样化服务类型。其次,数据集经过严格的统计分析,包括密码长度分布(6-12字符为主)、模式分类(19种结构特征)及频率分布(Zipf-like特性)的量化,揭示了人类密码的共性规律与区域差异。此外,框架支持多模型联合攻击评估,通过Jaccard指数和Mergeability指数量化模型输出的互补性,为密码安全研究提供了多维度的评估基准。
使用方法
使用MAYA需遵循其标准化流程:用户可选择特定数据集和模型(如LSTM-based FLA或Transformer-based PassGPT),配置密码最大长度(8/10/12字符)和生成数量(10^6至5×10^8次猜测)。框架提供七类研究问题的预设场景,例如跨文化泛化性测试(RQ4)或密码复杂度分析(RQ5)。用户可通过组合不同模型的输出实现多模型攻击优化,或利用内置指标(如IMD、MTopDiv)评估生成密码的人类相似性。所有实验可通过GitHub开源代码复现,支持自定义模块扩展以满足特定研究需求。
背景与挑战
背景概述
MAYA是由罗马萨皮恩扎大学的William Corrias、Fabio De Gaspari、Dorjan Hitaj和Luigi V. Mancini于2025年提出的一个统一、可定制、即插即用的密码猜测基准测试框架。该框架旨在解决生成模型在密码猜测领域研究中存在的不一致性和缺乏严格评估的问题。MAYA通过提供标准化的数据预处理方法、先进的测试场景和八个真实密码数据集,为生成密码猜测模型的评估提供了全面的解决方案。该数据集对密码安全领域的研究具有重要意义,特别是在评估生成模型的真实潜力和推动密码安全机制的进一步发展方面。
当前挑战
MAYA数据集面临的挑战主要包括两个方面:1) 领域问题的挑战:密码猜测领域的主要挑战在于如何准确模拟人类创建的密码的复杂性、结构和模式,特别是在处理长且复杂的密码时,生成模型的有效性显著下降。2) 构建过程中的挑战:在构建MAYA数据集时,研究人员需要解决不同研究之间评估方法不一致的问题,包括数据预处理算法、文件编码、词汇表、最大密码长度等因素的差异,以及缺乏对模型在复杂场景下的严格评估。此外,确保生成密码与人类创建的密码在分布上的一致性也是一个重要挑战。
常用场景
经典使用场景
MAYA数据集在密码安全研究领域被广泛应用于生成式密码猜测模型的标准化评估。通过整合八个真实泄露的密码数据集和六种最先进的生成模型,该数据集为研究者提供了一个统一的基准测试框架,用于比较不同模型在密码猜测任务中的性能。其经典使用场景包括评估模型在不同密码长度、训练数据规模和跨文化数据集上的泛化能力,以及分析模型生成的密码与人类创建密码的分布相似性。
衍生相关工作
基于MAYA的基准测试成果,衍生出多个重要研究方向:1) PassGPT等基于Transformer的模型进一步优化了序列密码生成能力;2) 研究者开发了结合VAE和GPT2的混合架构VGPT2;3) 在密码安全应用领域,MAYA的评估方法被扩展用于改进蜜词生成系统和动态密码策略。相关论文《PassFlow: Guessing Passwords with Generative Flows》和《PassGPT: Password Modeling with Large Language Models》均引用该数据集作为核心评估基准。
数据集最近研究
最新研究方向
近年来,MAYA数据集在密码安全领域的研究方向主要集中在生成式密码猜测模型的标准化评估与性能优化。该数据集通过整合多种先进的生成模型(如PassGAN、PLR-GAN、PassFlow等)和真实泄露密码数据集,为密码猜测技术提供了统一的基准测试框架。研究热点包括模型在跨文化和跨社区场景下的泛化能力、复杂密码的猜测效率,以及多模型联合攻击策略的有效性。这些研究不仅揭示了生成模型在密码安全中的潜力与局限,还为密码策略设计(如长度和复杂度要求)提供了实证依据。MAYA的标准化方法显著提升了不同模型间的可比性,推动了密码安全领域从传统规则方法向基于机器学习的生成式方法的范式转变。
相关研究论文
- 1MAYA: Addressing Inconsistencies in Generative Password Guessing through a Unified Benchmark罗马大学 · 2025年
以上内容由遇见数据集搜集并总结生成



