CySecBench
收藏github2025-01-08 更新2025-01-15 收录
下载链接:
https://github.com/cysecbench/dataset
下载链接
链接失效反馈官方服务:
资源简介:
CySecBench是一个专注于网络安全领域的生成式AI提示数据集,包含12662个提示,分为10个类别,用于评估大型语言模型的安全机制。
CySecBench is a cybersecurity-focused generative AI prompt dataset comprising 12,662 prompts categorized into 10 classes, designed to evaluate the security mechanisms of large language models.
创建时间:
2025-01-02
原始信息汇总
CySecBench 数据集概述
数据集简介
CySecBench 是一个专注于网络安全的生成式人工智能数据集,旨在为大型语言模型(LLMs)提供基准测试。该数据集包含 12662 个针对网络安全挑战的提示,涵盖了 10 个不同的类别。
数据集特点
- 类别:数据集分为 10 个类别,每个类别对应一种网络安全攻击或技术:
- 云攻击
- 控制系统攻击
- 加密攻击
- 规避技术
- 硬件攻击
- 入侵技术
- IoT 攻击
- 恶意软件攻击
- 网络攻击
- Web 应用攻击
数据集结构
- 数据集文件:每个类别对应一个 CSV 文件,包含该类别下的提示。
- 完整数据集:
cysecbench.csv包含所有类别的提示。 - 样本集:提供了不同规模的样本集(500、2000、6000 条提示)。
评估指标
- 成功率(SR):提示绕过伦理准则的百分比。
- 平均评分(AR):LLM 回答的有害程度评分(1-5 分,5 分为最有害)。
评估结果
| LLM | 成功率(SR) | 平均评分(AR) |
|---|---|---|
| Claude | 17.4% | 2.00 |
| ChatGPT | 65.4% | 4.06 |
| Gemini | 88.4% | 4.77 |
引用
如果使用 CySecBench 数据集,请引用以下文献: bibtex @article{CySecBench2024, title = {{CySecBench: Generative AI-based CyberSecurity-focused Prompt Dataset for Benchmarking Large Language Models}}, author = {Johan Wahréus and Ahmed Mohamed Hussain and Panos Papadimitratos}, year = {2025}, journal = {arXiv preprint arXiv:2501.01335}, url = {https://arxiv.org/abs/2501.01335} }
许可证
该项目采用 MIT 许可证,详细信息请参阅 LICENSE 文件。
搜集汇总
数据集介绍

构建方式
CySecBench数据集的构建基于生成式人工智能技术,专注于网络安全领域。该数据集通过精心设计的提示词生成方法,结合了提示词混淆和优化技术,生成了12662个针对网络安全挑战的提示词。这些提示词被系统地分为10个类别,涵盖了从云攻击到网络攻击的广泛领域,确保了数据集的全面性和针对性。
使用方法
CySecBench数据集的使用方法包括通过Python脚本进行数据生成和处理,用户需安装Python 3.8及以上版本,并配置必要的库如`openai`。数据集提供了完整的提示词集和多个样本集,用户可以根据需要选择不同规模的数据进行实验。此外,数据集的使用还包括对大型语言模型的性能评估,通过成功率(SR)和平均评分(AR)等指标,用户可以深入分析模型在网络安全任务中的表现。
背景与挑战
背景概述
CySecBench数据集由Johan Wahréus、Ahmed Mohamed Hussain和Panos Papadimitratos等研究人员于2025年创建,旨在为生成式人工智能在网络安全领域的应用提供基准测试工具。该数据集包含12662个针对网络安全挑战的提示,分为10个类别,涵盖了从云攻击到网络应用攻击的广泛领域。CySecBench的推出填补了现有数据集在网络安全领域缺乏针对性的空白,为评估大型语言模型(LLMs)的安全机制提供了精确的工具。该数据集的研究成果已在arXiv预印本平台上发布,并获得了广泛的学术关注。
当前挑战
CySecBench数据集面临的挑战主要集中在两个方面。首先,在领域问题方面,该数据集旨在解决生成式人工智能在网络安全应用中的伦理和安全问题,特别是如何通过提示工程绕过模型的伦理限制。这一挑战的核心在于如何设计出既能有效测试模型安全性,又不会引发实际安全风险的提示。其次,在数据集构建过程中,研究人员需要克服数据多样性和复杂性的挑战,确保每个类别的提示能够全面覆盖网络安全的不同方面。此外,如何平衡提示的多样性与模型的泛化能力,也是构建过程中需要解决的关键问题。
常用场景
经典使用场景
CySecBench数据集专为评估大型语言模型(LLMs)在网络安全领域的表现而设计,涵盖了12662个针对网络安全挑战的提示。这些提示被细分为10个类别,如云攻击、控制系统攻击、加密攻击等,使得研究人员能够精确评估LLMs在面对特定网络安全威胁时的反应能力。通过这一数据集,研究人员可以深入分析LLMs在处理复杂网络安全问题时的表现,从而推动相关技术的发展。
解决学术问题
CySecBench数据集解决了现有数据集在网络安全领域缺乏针对性的问题。通过提供领域特定的提示,该数据集使得研究人员能够更准确地评估LLMs在应对网络安全威胁时的表现。这不仅填补了现有研究的空白,还为开发更安全的AI系统提供了重要的数据支持。通过这一数据集,研究人员可以更好地理解LLMs在面对复杂网络安全问题时的局限性,从而推动相关技术的改进。
实际应用
CySecBench数据集在实际应用中具有广泛的价值。例如,网络安全公司可以利用该数据集来测试和优化其AI系统的安全性,确保在面对各种网络攻击时能够提供有效的防护。此外,该数据集还可以用于培训网络安全专家,帮助他们更好地理解和应对复杂的网络威胁。通过这一数据集,企业可以提升其网络安全防护能力,减少潜在的安全风险。
数据集最近研究
最新研究方向
随着生成式人工智能在网络安全领域的广泛应用,CySecBench数据集应运而生,成为评估大型语言模型(LLMs)在网络安全任务中表现的重要基准。该数据集包含12662个针对网络安全挑战的提示,涵盖云攻击、控制系统攻击、加密攻击等10个类别,为研究者提供了精准的评估工具。近年来,随着网络攻击手段的不断演变,生成式AI在防御和攻击中的应用成为研究热点。CySecBench通过引入新颖的越狱方法,如提示混淆和优化,揭示了LLMs在应对复杂网络安全威胁时的潜在漏洞。其评估结果显示,不同LLMs在面对恶意提示时的成功率差异显著,Gemini的成功率高达88.4%,而ChatGPT和Claude分别为65.4%和17.4%。这一研究不仅为LLMs的安全性评估提供了重要参考,也为未来开发更安全的AI系统奠定了数据基础。
以上内容由遇见数据集搜集并总结生成



