deadbits/vigil-jailbreak-ada-002
收藏Hugging Face2023-09-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/deadbits/vigil-jailbreak-ada-002
下载链接
链接失效反馈官方服务:
资源简介:
Vigil: LLM Jailbreak embeddings数据集包含用于检测大型语言模型(LLM)提示注入、越狱和其他潜在风险输入的文本嵌入。该数据集使用`text-embedding-ada-002`模型生成嵌入,并提供了将这些嵌入加载到Vigil chromadb实例或自定义应用中的方法。数据格式为JSON,包含文本和对应的嵌入向量。
提供机构:
deadbits
原始信息汇总
Vigil: LLM Jailbreak embeddings
概述
Vigil 是一个用于评估大型语言模型(LLM)提示的Python框架和REST API,旨在检测提示注入、越狱和其他潜在风险输入。
数据集内容
该数据集包含所有用于Vigil的“越狱”提示的text-embedding-ada-002嵌入。
格式
数据集格式为JSON,具体如下: json [ { "text": str, "embedding": [], "model": "text-embedding-ada-002" } ]
使用方法
可以使用parquet2vdb.py工具将嵌入加载到Vigil的chromadb实例中,或在自己的应用程序中使用。
数据来源
越狱提示来源于:https://github.com/laiyer-ai/llm-guard/blob/399cb2eea70afc78482db226253ddd1d85f296e3/llm_guard/resources/jailbreak.json
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是 Vigil 框架的一部分,专门用于大型语言模型(LLM)安全评估,包含 104 条 jailbreak 提示的文本及其对应的 text-embedding-ada-002 模型生成的嵌入向量。这些数据旨在帮助检测和防范 LLM 的提示注入、越狱攻击等安全风险,适用于安全研究和模型训练场景。数据集格式为 Parquet,规模较小但聚焦于关键安全领域。
以上内容由遇见数据集搜集并总结生成



