MaliciousAgentSkillsBench
收藏github2026-02-07 更新2026-02-14 收录
下载链接:
https://github.com/protectskills/MaliciousAgentSkillsBench
下载链接
链接失效反馈官方服务:
资源简介:
这是一个针对Claude代码代理技能的全面安全基准数据集,包含从两个主要平台(skills.rest和skillsmp.com)收集的98,380个技能,其中157个是通过系统安全分析识别的恶意样本。数据集包含恶意技能样本和完整技能数据集,并提供了详细的统计信息和分类。
This is a comprehensive security benchmark dataset for Claude code agent skills. It contains 98,380 skills collected from two major platforms: skills.rest and skillsmp.com, among which 157 malicious samples were identified through systematic security analysis. The dataset includes both malicious skill samples and the full skill dataset, and provides detailed statistical information and classifications.
创建时间:
2026-02-07
原始信息汇总
MaliciousAgentSkillsBench 数据集概述
数据集基本信息
- 数据集名称: MaliciousAgentSkillsBench
- 核心内容: 一个针对Claude Code Agent Skills的综合安全基准数据集与评估框架。
- 数据规模: 共包含 98,380 个技能样本。
- 恶意样本: 包含 157 个经过系统安全分析确认的恶意技能样本。
- 数据来源: 采集自两个主要平台:skills.rest 和 skillsmp.com。
数据结构与文件
数据文件
-
malicious_skills.csv- 内容: 包含 157 个已验证的恶意代理技能样本,来自 69 个独立的代码仓库。
- 列信息:
source: 数据来源 (skills.rest / skillsmp.com)repo: 仓库标识符skill_name: 恶意技能的名称classification: 安全分类 (malicious)Pattern: 检测到的漏洞模式 (分号分隔)
-
skills_dataset.csv- 内容: 包含 98,380 个技能样本的完整数据集,带有安全分类(其中157个被标记为恶意)。
- 列信息:
source: 数据来源 (skills.rest / skillsmp.com)repo: 仓库标识符skill_name: 技能名称classification: 安全分类 (safe / suspicious / malicious)url: 技能仓库的下载URL
数据集统计
| 来源 | 仓库数 | 技能总数 | 可疑技能数 | 恶意技能数 |
|---|---|---|---|---|
| skills.rest | 3,217 | 25,187 | 814 | 21 |
| skillsmp.com | 10,373 | 73,193 | 3,473 | 136 |
| 总计 | 13,590 | 98,380 | 4,287 | 157 |
相关代码与分析框架
数据集配套提供了一个完整的安全分析流水线,位于 code/ 目录下,用于对Claude Code Skills进行安全分析。
流水线步骤概述
| 步骤 | 脚本 | 描述 |
|---|---|---|
| 1 | 01_crawl.sh |
从 skills.rest 和 skillsmp.com 爬取技能元数据 |
| 2 | 02_generate_mapping.sh |
生成仓库映射 |
| 3 | 03_download.sh |
从 GitHub 下载技能仓库 |
| 4 | 04_scan.sh |
基于规则的静态安全扫描 |
| 5 | 05_gen_cc_queue.sh |
生成 Claude Code 分析队列 |
| 6 | 06_cc_analyze.sh |
AI驱动的深度安全审计 |
| 7 | 07_gen_run_queue.sh |
生成动态执行队列 |
| 8 | 08_execute.sh |
在Docker沙箱中执行技能并监控 |
关键组件
- 分析器 (
analyzer/): 集成Claude Code进行AI驱动的安全分析。 - 扫描器 (
scanner/): 基于规则的静态安全扫描器。 - 执行器 (
executor/): 在Docker沙箱中执行技能,包含文件系统和网络监控。
输出结构
scan_results/: 按安全分类(SAFE, SUSPICIOUS, MALICIOUS)存放扫描结果。execution_logs/: 按风险等级存放动态执行日志,包含系统调用跟踪、网络流量捕获、文件系统修改记录等。
使用目的与免责声明
- 目的: 本数据集和代码库专用于以下目的:
- 关于AI代理安全的学术研究。
- 开发针对恶意代理技能的防御机制。
- 评估AI代理平台的鲁棒性。
- 免责声明: 本仓库包含的恶意代理技能示例仅用于研究目的。严禁任何滥用行为。
许可信息
- 许可证: MIT 许可证。
搜集汇总
数据集介绍

构建方式
在人工智能代理安全研究领域,构建高质量的数据集是评估和防御恶意技能的基础。MaliciousAgentSkillsBench数据集通过系统化的安全分析流程构建而成,其过程涵盖多平台数据爬取、静态规则扫描、AI驱动的深度安全审计以及动态沙箱执行监控。具体而言,研究团队从skills.rest和skillsmp.com两大平台爬取了共计98,380个技能样本,并利用混合分析方法识别出157个经过验证的恶意样本。整个构建流程在Docker沙箱环境中进行,确保了分析过程的安全性与可复现性,从而为后续的安全研究提供了可靠的数据支撑。
特点
该数据集在人工智能代理安全基准测试中展现出显著的特点。其规模涵盖近十万个技能样本,并精细标注了安全分类,包括安全、可疑与恶意三类,其中恶意样本均经过多阶段验证。数据集中不仅包含技能元数据,还提供了详细的漏洞模式分类与执行日志,如系统调用追踪、网络流量捕获及文件系统变更记录。这些多维度的特征使得数据集能够支持从静态检测到动态行为分析的全面安全评估,为研究者深入理解恶意技能的运作机制与防御策略提供了丰富的实证材料。
使用方法
针对人工智能安全领域的研究需求,该数据集提供了清晰的使用路径。用户可通过加载提供的CSV文件快速获取恶意技能列表或完整数据集,并利用附带的代码框架执行端到端的安全分析管道。该框架支持从数据爬取、静态扫描、AI审计到沙箱动态执行的完整流程,且允许通过配置文件自定义分析参数与阈值。研究者可依据自身需求,运行特定分析步骤或利用预置的Docker沙箱环境进行安全的技能执行与监控,从而在受控条件下开展恶意行为检测与防御机制验证等实验。
背景与挑战
背景概述
随着人工智能代理技术的快速发展,Claude Code Agent等智能体平台通过技能扩展机制极大地增强了功能灵活性,然而这也引入了潜在的安全风险。恶意技能可能利用系统漏洞执行未授权操作,对用户隐私和系统完整性构成威胁。在此背景下,MaliciousAgentSkillsBench数据集应运而生,由匿名研究团队于2026年构建,旨在系统性地检测和分析恶意代理技能。该数据集从skills.rest和skillsmp.com两大平台收集了98,380项技能,并识别出157个恶意样本,为AI代理安全领域提供了首个综合性安全基准。其核心研究问题聚焦于恶意技能的检测、分类与理解,通过结合静态扫描、动态沙箱执行与AI深度分析,推动了智能体安全防御机制的发展,对提升AI系统的鲁棒性具有重要影响力。
当前挑战
该数据集致力于解决AI代理安全领域中的恶意技能检测挑战,具体包括识别技能中隐藏的代码注入、权限提升及数据泄露等复杂攻击模式。由于恶意行为往往经过精心伪装,传统规则检测方法难以应对不断演变的对抗性技巧,需要结合动态分析与AI推理能力。在构建过程中,研究团队面临数据采集的规模与质量平衡难题,需从异构平台高效爬取大量技能并确保样本代表性。同时,安全分析需在隔离的Docker沙箱中执行动态监控,以避免对真实系统造成危害,这增加了计算资源与时间开销。此外,标注恶意样本依赖多阶段验证流程,包括静态规则匹配与Claude Code的深度审计,确保分类准确性,这些环节共同构成了数据集构建的技术与工程挑战。
常用场景
经典使用场景
在人工智能代理安全研究领域,MaliciousAgentSkillsBench数据集为评估Claude Code Agent Skills的安全性提供了关键基准。该数据集通过系统化收集来自skills.rest和skillsmp.com平台的98,380个技能样本,并精心标注了157个恶意样本,为研究人员构建了一个全面的安全分析框架。经典使用场景包括利用其静态规则扫描与AI驱动的深度安全审计相结合的分析管道,在隔离的Docker沙箱环境中动态执行技能并监控系统调用、网络流量及文件系统变更,从而系统性地识别恶意行为模式,如代码注入、权限提升或数据泄露等漏洞。
实际应用
在实际应用层面,MaliciousAgentSkillsBench数据集及其配套分析框架可直接服务于AI代理平台的安全加固与风险评估。平台开发者可利用该数据集的标注结果和检测规则,集成自动化安全扫描工具至技能商店的审核流程,实现上线前的恶意代码筛查。安全团队可借鉴其动态执行与监控方案,构建内部的红队测试环境,以评估现有代理系统对新型攻击的抵御能力。此外,该数据集也为制定行业安全标准与最佳实践提供了实证依据,助力于提升整个AI代理生态系统的信任度与可靠性。
衍生相关工作
围绕MaliciousAgentSkillsBench数据集,已衍生出多个经典研究方向与相关工作。在检测方法上,研究者基于其标注的漏洞模式,开发了结合静态特征提取与动态行为分析的混合检测模型,显著提升了恶意技能的识别精度与效率。在防御机制方面,相关工作聚焦于设计轻量级沙箱隔离策略与实时行为监控系统,以限制恶意技能的破坏范围。此外,该数据集也催生了针对AI代理技能供应链安全的研究,探讨了技能仓库的准入审核、开发者信誉评估以及漏洞披露协调等治理框架,形成了从技术检测到生态治理的完整研究链条。
以上内容由遇见数据集搜集并总结生成



