five

GenTel-Bench|大型语言模型数据集|提示注入攻击数据集

收藏
arXiv2024-09-29 更新2024-10-02 收录
大型语言模型
提示注入攻击
下载链接:
https://gentellab.github.io/gentelsafe.github.io/
下载链接
链接失效反馈
资源简介:
GenTel-Bench是由GenTel.io和浙江大学联合创建的综合性评估基准,专门用于检测和防御大型语言模型(LLMs)中的提示注入攻击。该数据集包含84812条攻击样本,涵盖三大类别和28个安全场景。数据集的创建过程结合了现有的开源数据集和大型语言模型生成的测试数据,确保了数据的真实性和多样性。该数据集主要应用于评估和提升LLMs的安全性,旨在解决提示注入攻击带来的安全风险。
提供机构:
GenTel.io, 浙江大学
创建时间:
2024-09-29
AI搜集汇总
数据集介绍
main_image_url
构建方式
GenTel-Bench数据集的构建基于对现有开源数据集的改编和扩展,结合了大型语言模型(LLMs)生成的测试数据。具体而言,研究团队首先精心挑选涵盖多种安全场景的测试样本,然后设计了针对注入攻击的提示模板,并使用高级模型如GPT-4进行重写,确保输入令牌长度在60到100之间。最终,通过将攻击提示模板与测试样本结合,创建了一个包含超过170,000数据点的综合新数据集。
特点
GenTel-Bench数据集的特点在于其全面性和多样性,涵盖了84,812个提示注入攻击,跨越3个主要类别和28个安全场景。此外,该数据集还包括了基于应用场景的良性数据,提供了对LLMs在实际操作中性能和安全性的全面评估。这种双重视角的整合使得GenTel-Bench成为评估模型在不同应用上下文和相关风险中表现的重要工具。
使用方法
GenTel-Bench数据集主要用于评估和验证针对提示注入攻击的防御模型的有效性。研究者和开发者可以使用该数据集来测试其模型的攻击检测能力,通过对比不同模型在数据集上的表现,评估其在真实世界应用中的鲁棒性和可靠性。此外,数据集的公开发布也为进一步的研究和开发提供了基础,促进了LLMs安全防御技术的发展。
背景与挑战
背景概述
随着大型语言模型(LLMs)如GPT-4、LLaMA和Qwen在多个应用领域的显著成功,其安全性问题也日益凸显。这些模型在面对提示注入攻击时显得尤为脆弱,这种攻击能够绕过现有的安全机制,导致生成不当内容。为了应对这一挑战,GenTel.io与浙江大学合作,于2024年推出了GenTel-Safe框架,其中包括GenTel-Shield检测方法和GenTel-Bench评估基准。GenTel-Bench数据集包含了84,812个提示注入攻击样本,覆盖三大类别和28个安全场景,旨在为检测和防御提示注入攻击提供全面的评估工具。该数据集的发布不仅推动了LLMs安全研究的发展,也为实际应用中的安全防护提供了重要的参考。
当前挑战
GenTel-Bench数据集在构建过程中面临多重挑战。首先,提示注入攻击的多样性和隐蔽性使得数据集的收集和标注工作异常复杂。其次,现有的防御方法在面对新型攻击时表现不佳,尤其是在处理跨模型的攻击和多步攻击时。此外,数据集的通用性和可扩展性也是一个重要问题,如何在不同语言和应用场景下保持检测效果的一致性,是当前研究的一个难点。最后,随着LLMs的不断更新和进化,如何持续更新和维护数据集,以应对新兴的攻击手段,也是一个亟待解决的问题。
常用场景
经典使用场景
GenTel-Bench数据集在评估大型语言模型(LLMs)对提示注入攻击的防御能力方面具有经典应用场景。该数据集包含了84,812个提示注入攻击样本,涵盖三大类别和28个安全场景,为研究人员提供了一个全面的评估框架。通过使用GenTel-Bench,研究人员可以系统地测试和比较不同防御方法在检测和抵御提示注入攻击方面的效果,从而推动更强大的攻击检测方法的发展。
解决学术问题
GenTel-Bench数据集解决了大型语言模型在面对提示注入攻击时的脆弱性问题。这些攻击能够绕过现有的安全机制,导致模型生成不当内容,从而引发严重的安全风险。通过提供一个包含多种攻击类型和场景的全面基准,GenTel-Bench帮助学术界更好地理解和评估这些攻击的复杂性,推动了针对提示注入攻击的防御技术的研究和发展。
衍生相关工作
基于GenTel-Bench数据集,许多相关工作得以展开,进一步推动了LLMs安全领域的研究。例如,GenTel-Shield作为一种模型无关的防御方法,通过使用该数据集进行评估,展示了其在检测提示注入攻击方面的卓越性能。此外,其他研究者也利用GenTel-Bench开发了新的防御策略和评估方法,为LLMs的安全性研究提供了丰富的资源和工具。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

海天瑞声-超大规模中文多领域高质量多轮对话语料库

这是一个符合中国人表达习惯的自然对话数据集,共计约1,0000,000轮,上亿级token,包含正式&非正式风格对话,使用偏口语化自然表达。覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上,DOTS-NLP-216包含了对真实场景的对话采集,及高度还原真实场景的模拟对话这两种方式,兼顾分布的代表性、多样性和样本规模。

魔搭社区 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录