five

Gandalf Attack Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/lakeraai/dsec-gandalf
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了27.9万个通过一种众包、游戏化的红队平台生成的提示攻击,该平台旨在评估大型语言模型应用中对抗提示攻击的防御能力。此外,该数据集补充了良性用户数据,以便分析大型语言模型应用中安全性与可用性之间的相互作用。其规模达到了279,000个提示攻击,任务是对大型语言模型防御中的安全性与实用性权衡进行评估。
提供机构:
Gandalf platform
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作