prompt-injection-dataset|安全威胁数据集|分类任务数据集

huggingface2024-11-29 更新2024-12-12 收录

安全威胁

分类任务

下载链接：

https://huggingface.co/datasets/geekyrakshit/prompt-injection-dataset

下载链接

链接失效反馈

资源简介：

该数据集用于分类任务，主要特征包括'prompt'（字符串类型）和'label'（int64类型）。数据集分为训练集和测试集，分别包含270520和263914个样本。数据集的总下载大小为125839975字节，总大小为204739881字节。数据集的语言为英语，标签为'security'，显示名称为'Prompt Injection Classification'。数据集是从deepset/prompt-injections、xTRam1/safe-guard-prompt-injection和jayavibhav/prompt-injection三个数据集中收集的。

创建时间：

2024-11-27

原始信息汇总

数据集概述

数据集信息

名称: Prompt Injection Classification
语言: 英语 (en)
标签: 安全 (security)

数据特征

特征:
- prompt: 字符串类型 (string)
- label: 64位整数类型 (int64)

数据集划分

训练集:
- 样本数量: 270520
- 字节数: 103644975
测试集:
- 样本数量: 263914
- 字节数: 101094906

数据集大小

下载大小: 125839975 字节
数据集总大小: 204739881 字节

数据文件配置

配置名称: default
数据文件路径:
- 训练集: data/train-*
- 测试集: data/test-*

数据来源

来源数据集:
- deepset/prompt-injections
- xTRam1/safe-guard-prompt-injection
- jayavibhav/prompt-injection

AI搜集汇总

数据集介绍

构建方式

该数据集通过整合多个来源的提示注入（Prompt Injection）数据构建而成，具体包括deepset/prompt-injections、xTRam1/safe-guard-prompt-injection以及jayavibhav/prompt-injection等数据集。这些数据集经过筛选和标注，形成了包含训练集和测试集的标准化数据结构，旨在为提示注入分类任务提供丰富的数据支持。

特点

该数据集的主要特点在于其专注于提示注入这一安全领域的特定问题，涵盖了多种可能的注入场景和攻击方式。数据集中的每个样本均包含一个提示文本及其对应的标签，标签用于区分是否存在注入行为。此外，数据集的规模较大，训练集和测试集分别包含270520和263914个样本，为模型训练和评估提供了充足的数据基础。

使用方法

该数据集适用于提示注入分类任务，用户可以通过加载数据集中的训练集和测试集进行模型训练和评估。数据集的结构设计使得用户可以轻松地将其集成到现有的机器学习工作流中，利用提示文本和标签进行监督学习。此外，数据集支持多种语言，尤其是英语，为跨语言的提示注入检测提供了可能性。

背景与挑战

背景概述

在自然语言处理领域，随着生成式模型的广泛应用，提示注入（Prompt Injection）问题逐渐成为研究焦点。提示注入是指通过精心设计的输入，诱导模型产生非预期的输出，从而威胁模型的安全性。为了应对这一挑战，研究人员创建了Prompt Injection Dataset，该数据集由多个子数据集组成，包括deepset/prompt-injections、xTRam1/safe-guard-prompt-injection和jayavibhav/prompt-injection。这些数据集的构建旨在为研究人员提供一个标准化的测试平台，以评估和改进模型在面对提示注入攻击时的鲁棒性。

当前挑战

提示注入数据集的构建面临多重挑战。首先，如何设计有效的提示注入样本，使其既能模拟真实攻击场景，又不失一般性，是一个复杂的问题。其次，数据集的标注需要高度专业性，确保每个样本的标签准确反映其是否构成提示注入。此外，随着生成式模型的不断演进，提示注入的形式和手段也在不断变化，这要求数据集能够持续更新和扩展，以保持其时效性和实用性。

常用场景

经典使用场景

在自然语言处理领域，prompt-injection-dataset 主要用于检测和分类提示注入攻击。该数据集通过提供大量包含恶意提示的样本，帮助研究人员训练和评估模型在面对潜在安全威胁时的鲁棒性。其经典使用场景包括构建和测试对抗性提示检测模型，确保模型在实际应用中能够有效识别并防御此类攻击。

衍生相关工作

prompt-injection-dataset 的发布催生了一系列相关研究工作，特别是在对抗性学习和模型安全性领域。许多研究者基于该数据集开发了新的检测算法和防御机制，进一步提升了模型在面对提示注入攻击时的鲁棒性。此外，该数据集还激发了对提示注入攻击的深入理论研究，推动了相关安全标准的制定和实施。

数据集最近研究

最新研究方向

在自然语言处理与人工智能安全领域，prompt-injection-dataset的最新研究方向主要集中在提升模型对恶意提示注入攻击的防御能力。随着生成式AI模型的广泛应用，提示注入攻击成为威胁模型安全性的重要问题。该数据集通过整合多个来源的提示注入样本，为研究者提供了丰富的实验材料，以开发更鲁棒的防御机制。相关研究不仅关注如何识别和过滤恶意提示，还探索了在不影响模型正常功能的前提下，增强模型对复杂攻击模式的抵抗力。这一领域的进展对于保障AI系统的安全性和可靠性具有深远意义。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源，是提供人类基本需求和基本社会保障的先决条件；也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础，兼具学术、经济、社会等多种价值。本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分（含胆固醇）数据，657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集，旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段，涵盖超过70种不同的复杂背景，确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向，通过收集大量真实场景下的手语视频材料，覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域，旨在提高手语识别技术在复杂环境中的准确性和效率，促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

Google Scholar

Google Scholar是一个学术搜索引擎，旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域，包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。

scholar.google.com 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集，主要由非网络来源的内部数据构成，包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容，质量优异，信息密度可观。数据集适用于预训练或继续预训练用途，未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用，但建议先使用配套的预训练数据集对模型进行继续预训练后，再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据，以避免灾难性遗忘并加强模型表现。

huggingface 收录