llm-jailbreak-prompt-injection-dataset

Hugging Face2026-03-23 更新2026-03-24 收录

下载链接：

https://huggingface.co/datasets/Necent/llm-jailbreak-prompt-injection-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

AI Security Dataset 是一个包含 691,331 个样本的统一数据集，涵盖 26 种语言，用于 AI 安全研究。数据集整合了 15 个来源的数据，主要关注安全、越狱、提示注入、毒性、红队测试和 AI 安全等任务。数据集的 schema 包括以下字段：prompt（攻击/测试提示文本）、response（模型响应，如果可用）、model_name（目标模型，如果指定）、prompt_type（越狱/提示注入/混淆/语言/毒性/有害行为）、category（源数据集中的特定子类别）、is_dangerous（1 表示危险/有害，0 表示安全/良性）、source（源数据集名称）和 language（ISO 639-1 语言代码）。数据集的主要来源包括 PolyglotToxicityPrompts、LLMail-Inject、LinguaSafe、RedBench 等，其中毒性提示占比最高（426,450 个样本）。数据集旨在用于训练安全分类器和评估 LLM 的鲁棒性，但包含有害、有毒和冒犯性内容，仅限研究使用。

创建时间：

2026-03-21