five

大型语言模型数据集|安全评估数据集

收藏
库帕思2025-12-08 更新2025-12-20 收录
下载链接:
https://www.kupasai.com/corpus/detail?id=448&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
<p>Agent Security Bench (ASB) 是一个综合性的基准框架,旨在规范化、基准化和评估基于大型语言模型(LLM)的代理在不同场景下的攻击和防御策略。该数据集涵盖了10个场景(如电子商务、自动驾驶、金融),10个代理,超过400个工具和任务,用于评估LLM代理的安全性。数据集涉及23种不同的攻击/防御方法和7个评估指标。</p><p>应用场景:主要用于评估 LLM-based Agent 在面对各类安全攻击时的脆弱性,以及不同防御机制的有效性,为 Agent 安全研究提供基准测试框架,助力提升 LLM 代理系统的安全性。</p>
提供机构:
库帕思
创建时间:
2025-09-24
二维码
社区交流群
二维码
科研交流群
商业服务