deadbits/vigil-jailbreak-ada-002

Name: deadbits/vigil-jailbreak-ada-002
Creator: deadbits
Published: 2023-09-09 00:31:12
License: 暂无描述

Hugging Face2023-09-09 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/deadbits/vigil-jailbreak-ada-002

下载链接

链接失效反馈

官方服务：

资源简介：

Vigil: LLM Jailbreak embeddings数据集包含用于检测大型语言模型（LLM）提示注入、越狱和其他潜在风险输入的文本嵌入。该数据集使用`text-embedding-ada-002`模型生成嵌入，并提供了将这些嵌入加载到Vigil chromadb实例或自定义应用中的方法。数据格式为JSON，包含文本和对应的嵌入向量。

提供机构：

deadbits

原始信息汇总

Vigil: LLM Jailbreak embeddings

概述

Vigil 是一个用于评估大型语言模型（LLM）提示的Python框架和REST API，旨在检测提示注入、越狱和其他潜在风险输入。

数据集内容

该数据集包含所有用于Vigil的“越狱”提示的text-embedding-ada-002嵌入。

格式

数据集格式为JSON，具体如下： json [ { "text": str, "embedding": [], "model": "text-embedding-ada-002" } ]

使用方法

可以使用parquet2vdb.py工具将嵌入加载到Vigil的chromadb实例中，或在自己的应用程序中使用。

数据来源

越狱提示来源于：https://github.com/laiyer-ai/llm-guard/blob/399cb2eea70afc78482db226253ddd1d85f296e3/llm_guard/resources/jailbreak.json

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是 Vigil 框架的一部分，专门用于大型语言模型（LLM）安全评估，包含 104 条 jailbreak 提示的文本及其对应的 text-embedding-ada-002 模型生成的嵌入向量。这些数据旨在帮助检测和防范 LLM 的提示注入、越狱攻击等安全风险，适用于安全研究和模型训练场景。数据集格式为 Parquet，规模较小但聚焦于关键安全领域。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集