five

deadbits/vigil-jailbreak-ada-002

收藏
Hugging Face2023-09-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/deadbits/vigil-jailbreak-ada-002
下载链接
链接失效反馈
官方服务:
资源简介:
Vigil: LLM Jailbreak embeddings数据集包含用于检测大型语言模型(LLM)提示注入、越狱和其他潜在风险输入的文本嵌入。该数据集使用`text-embedding-ada-002`模型生成嵌入,并提供了将这些嵌入加载到Vigil chromadb实例或自定义应用中的方法。数据格式为JSON,包含文本和对应的嵌入向量。
提供机构:
deadbits
原始信息汇总

Vigil: LLM Jailbreak embeddings

概述

Vigil 是一个用于评估大型语言模型(LLM)提示的Python框架和REST API,旨在检测提示注入、越狱和其他潜在风险输入。

数据集内容

该数据集包含所有用于Vigil的“越狱”提示的text-embedding-ada-002嵌入。

格式

数据集格式为JSON,具体如下: json [ { "text": str, "embedding": [], "model": "text-embedding-ada-002" } ]

使用方法

可以使用parquet2vdb.py工具将嵌入加载到Vigil的chromadb实例中,或在自己的应用程序中使用。

数据来源

越狱提示来源于:https://github.com/laiyer-ai/llm-guard/blob/399cb2eea70afc78482db226253ddd1d85f296e3/llm_guard/resources/jailbreak.json

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是 Vigil 框架的一部分,专门用于大型语言模型(LLM)安全评估,包含 104 条 jailbreak 提示的文本及其对应的 text-embedding-ada-002 模型生成的嵌入向量。这些数据旨在帮助检测和防范 LLM 的提示注入、越狱攻击等安全风险,适用于安全研究和模型训练场景。数据集格式为 Parquet,规模较小但聚焦于关键安全领域。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作