cowWhySo/pentest-redteam-steering
收藏Hugging Face2024-06-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/cowWhySo/pentest-redteam-steering
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含被Llama 3模型拒绝的提示,这些提示与安全和渗透测试相关,被认为是‘有害’的。数据集可以用于通过特定代码加载和处理,以生成有害指令的测试集。此外,该数据集还用于生成两个特定的模型。
提供机构:
cowWhySo
原始信息汇总
数据集概述
数据集名称
pentest-redteam-steering
数据集路径
- 在代码中使用的路径为:
cowWhySo/pentest-redteam-steering
数据集内容
- 数据集包含的指令类型为“有害”相关,主要涉及安全测试和渗透测试。
- 数据集中的每个样本包含一个
goal字段,记录了指令的目标。
数据集使用
- 用于指导模型生成,具体用于以下模型:
Llama-3-8B-Instruct-CybersecurityPhi-3-mini-4k-instruct-Cybersecurity
数据集处理
- 数据集通过
train_test_split方法被分为训练集和测试集,其中测试集占总数据的20%。 - 有害指令被提取并保存到
harmful_instructions.json文件中,仅保存了前10条指令。



