five

Knowledge-Jailbreak Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/THU-KEG/Knowledge-to-Jailbreak/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大规模的数据集,包含了12,974个知识逃逸对,用于评估大型语言模型(LLM)在运用领域知识时的安全性。数据集分为已知领域和未知领域,其中未知领域包含6个领域的91个数据点,用于测试。已知领域则按照8:2的比例分为训练集和测试集。该数据集的任务是通过知识驱动的逃逸生成来评估LLM的安全性。

This is a large-scale dataset comprising 12,974 knowledge escape pairs, developed to evaluate the safety of Large Language Models (LLMs) when leveraging domain-specific knowledge. The dataset is divided into known domains and unknown domains. The unknown domains include 91 data points across 6 domains for testing LLMs. The known domains are split into training and test sets at an 8:2 ratio. The task of this dataset is to evaluate the safety of LLMs via knowledge-driven escape generation.
提供机构:
THU-KEG
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作