five

LLM加密文本数据集

收藏
arXiv2025-05-30 更新2025-06-03 收录
下载链接:
https://anonymous.4open.science/r/Encryption-dataset-sample-883E/
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集由多种明文及其对应的加密版本组成,这些文本使用了九种不同的加密算法进行加密。数据集包含总计4509条数据,涵盖了科学、医疗、新闻标题、技术、社交媒体、法律、商业、文学和常见英文引语等多个领域。数据集旨在评估大型语言模型在加密分析方面的能力,特别是在不同文本类型、长度、领域和写作风格上的表现。

This dataset comprises various plaintexts and their corresponding encrypted versions, with the texts encrypted using nine distinct encryption algorithms. It contains a total of 4509 entries, covering multiple domains including science, medicine, news headlines, technology, social media, law, business, literature, and common English quotations. This dataset is designed to evaluate the capabilities of Large Language Models (LLMs) in cryptanalysis, particularly their performance across different text types, lengths, domains, and writing styles.
提供机构:
澳大利亚麦考瑞大学和澳大利亚新南威尔士大学
创建时间:
2025-05-30
搜集汇总
数据集介绍
main_image_url
构建方式
LLM加密文本数据集的构建采用了多维度设计策略,通过九种加密算法对多样化文本进行系统化加密处理。研究团队首先利用ChatGPT、Claude等先进大语言模型生成涵盖不同长度(短文本≤100字符,长文本≈300字符)、跨七种专业领域(科学、医学、法律等)以及莎士比亚文体与方言的原始文本。随后采用分层抽样方法,对501组基础文本样本分别实施凯撒密码、摩斯电码等传统加密算法以及RSA、AES等现代加密方案,最终形成包含4,509个加密-明文对的平衡数据集。为确保评估效度,所有加密操作均遵循标准密码学实现规范,如AES采用128位随机密钥,RSA使用e=65537固定公钥参数。
特点
该数据集的核心价值体现在三个维度:加密算法的梯度难度设计覆盖从简单替换密码到现代非对称加密的完整谱系,为评估大模型密码分析能力提供渐进式挑战;文本类型的多样性包含LLM生成内容与真实人类写作样本,有效检验模型对自然语言模式与加密扰动的双重理解;细粒度的元数据标注(如文本域分类、写作风格标识)支持多维度的性能归因分析。特别值得注意的是,数据集通过控制变量设计,使同一组原始文本经历不同加密算法处理,确保模型表现差异可明确归因于算法特性而非文本内容偏差。
使用方法
使用本数据集需遵循标准化评估框架:在零样本设定下,直接输入加密文本要求模型进行解密;在少样本场景中,可提供示例对(如凯撒密码的位移规则)引导模型理解加密模式。评估指标推荐采用精确匹配率(EM)衡量完全解密能力,标准化编辑距离(NL)评估部分解密效果,同时结合BLEU分数分析语义保真度。为检测潜在安全风险,可扩展评估模型对加密方法的识别准确率(F1值)及对部分解密文本的语义理解深度。所有实验应控制温度参数为0以保证结果可复现性,建议输出长度限制在1536个token内。
背景与挑战
背景概述
LLM加密文本数据集由Macquarie University和University of New South Wales的研究团队于2025年提出,旨在评估大语言模型(LLMs)在密码分析领域的潜力。该数据集包含多样化的明文及其通过多种加密算法生成的密文,覆盖不同领域、长度、写作风格和主题。研究团队通过零样本和少样本设置,测试了多种先进LLM在不同加密方案下的解密准确性和语义理解能力。该数据集的建立填补了LLM在密码分析领域评估的空白,为AI安全和加密技术的研究提供了重要基准。
当前挑战
LLM加密文本数据集面临的主要挑战包括:1) 领域问题的挑战:LLMs在解密任务中需要结合语言理解和高级数学推理,而现有模型在精确数值推理和推断方面存在局限;2) 构建过程的挑战:加密方案在字符或块级别操作,而LLMs主要基于词或子词标记训练,这种不匹配限制了模型在加密任务中的有效性。此外,数据集需要平衡不同加密算法的复杂性、文本长度和领域多样性,以确保评估的全面性和公平性。
常用场景
经典使用场景
在密码学与自然语言处理的交叉领域,LLM加密文本数据集为评估大型语言模型在密码分析任务中的表现提供了标准化测试平台。该数据集通过整合九种经典与现代加密算法(如凯撒密码、AES等)处理的多样化文本,支持研究者系统考察模型对加密信息的理解能力。其典型应用场景包括零样本和少样本条件下,测试模型对密文的解密准确率、语义还原度及加密方法识别能力,尤其关注模型在字符级替换、转置和现代加密算法中的泛化表现。
衍生相关工作
该数据集已催生多项重要研究:在攻击方法层面,启发了SelfCipher(Yuan等)和Bijection Learning(Huang等)等新型越狱技术;防御领域则衍生出RA-LLM的输入变异机制和SafeDecoding的安全解码策略。密码分析方面,推动了GAN-based(如EveGAN)与神经区分器(Gohr)的融合研究。数据集构建方法论更影响了后续跨模态安全基准(如ArtPrompt)的设计,形成以'预训练数据分布-模型能力边界-安全漏洞'为核心的研究范式。
数据集最近研究
最新研究方向
近年来,随着大语言模型(LLMs)在自然语言处理领域的广泛应用,其在加密文本分析(Cryptanalysis)中的潜力逐渐成为研究热点。LLM加密文本数据集的提出填补了这一领域的空白,为评估LLMs在解密任务中的表现提供了标准化基准。该数据集涵盖了多种加密算法(如Caesar、Atbash、Morse、AES等)生成的加密文本,并针对不同长度、风格和领域的文本进行了系统化设计。前沿研究主要聚焦于LLMs在零样本和小样本设置下的解密准确性与语义理解能力,同时揭示了模型在部分解密场景下可能被用于越狱攻击(jailbreaking)的安全隐患。这一研究方向不仅推动了AI在密码学领域的应用探索,也为大模型的安全对齐(Safety Alignment)和抗攻击能力提供了重要参考。
相关研究论文
  • 1
    Benchmarking Large Language Models for Cryptanalysis and Mismatched-Generalization澳大利亚麦考瑞大学和澳大利亚新南威尔士大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作