大型语言模型数据集|安全评估数据集

库帕思2025-12-08 更新2025-12-20 收录

下载链接：

https://www.kupasai.com/corpus/detail?id=448&type=1

下载链接

链接失效反馈

官方服务：

资源简介：

<p>Agent Security Bench (ASB) 是一个综合性的基准框架，旨在规范化、基准化和评估基于大型语言模型（LLM）的代理在不同场景下的攻击和防御策略。该数据集涵盖了10个场景（如电子商务、自动驾驶、金融），10个代理，超过400个工具和任务，用于评估LLM代理的安全性。数据集涉及23种不同的攻击/防御方法和7个评估指标。</p><p>应用场景：主要用于评估 LLM-based Agent 在面对各类安全攻击时的脆弱性，以及不同防御机制的有效性，为 Agent 安全研究提供基准测试框架，助力提升 LLM 代理系统的安全性。</p>

提供机构：

库帕思

创建时间：

2025-09-24