AdvBench 2
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/llm-attacks/llm-attacks/tree/main/data/advbench
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一组用于评估安全防护措施有效性的有害字符串集合,它包含了574个用于测试大型语言模型鲁棒性的有害字符串。其任务是对文本对抗性提示进行评估。
This dataset is a collection of harmful strings designed to evaluate the effectiveness of security protection measures. It includes 574 harmful strings intended for testing the robustness of Large Language Models (LLMs). The task of this dataset is to evaluate textual adversarial prompts.
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



