five

llm-jailbreak-prompt-injection-dataset

收藏
Hugging Face2026-03-23 更新2026-03-24 收录
下载链接:
https://huggingface.co/datasets/Necent/llm-jailbreak-prompt-injection-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
AI Security Dataset 是一个包含 691,331 个样本的统一数据集,涵盖 26 种语言,用于 AI 安全研究。数据集整合了 15 个来源的数据,主要关注安全、越狱、提示注入、毒性、红队测试和 AI 安全等任务。数据集的 schema 包括以下字段:prompt(攻击/测试提示文本)、response(模型响应,如果可用)、model_name(目标模型,如果指定)、prompt_type(越狱/提示注入/混淆/语言/毒性/有害行为)、category(源数据集中的特定子类别)、is_dangerous(1 表示危险/有害,0 表示安全/良性)、source(源数据集名称)和 language(ISO 639-1 语言代码)。数据集的主要来源包括 PolyglotToxicityPrompts、LLMail-Inject、LinguaSafe、RedBench 等,其中毒性提示占比最高(426,450 个样本)。数据集旨在用于训练安全分类器和评估 LLM 的鲁棒性,但包含有害、有毒和冒犯性内容,仅限研究使用。
创建时间:
2026-03-21
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作