Arkhiveus/unaligner1K_DPO

Name: Arkhiveus/unaligner1K_DPO
Creator: Arkhiveus
Published: 2024-06-13 14:45:26
License: 暂无描述

Hugging Face2024-06-13 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/Arkhiveus/unaligner1K_DPO

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个从三个不同数据集（toxic-dpo-v0.2、orthogonal-activation-steering-TOXIC、ToxicQAFinal）整合和清理而来的数据集。数据集使用Llama-Guard-2进行排序，并随机采样。新的拒绝回答由Llama-3-8B-Instruct生成，而新的选择回答则由Nous-Hermes-2-Yi-34B生成。数据集中包含了来自OAS-Toxic的311行、ToxicDPO的478行和ToxicQA的211行数据。此外，文件还列出了不同危害类别的发生次数。

提供机构：

Arkhiveus

原始信息汇总

DPO only version of unaligner1K 数据集概述

数据集来源

数据集由以下三个子数据集整合和清洗而成：

数据处理

数据集通过 Llama-Guard-2 进行排序，并随机采样。
新的拒绝样本由 Llama-3-8B-Instruct 生成。
OAS-Toxic 和 ToxicQA 的新选择答案由 Nous-Hermes-2-Yi-34B 生成。

数据集规模

OAS-Toxic: 311 行
ToxicDPO: 478 行
ToxicQA: 211 行

危害发生情况

S1: 62
S10: 20
S11: 171
S2: 400
S3: 145
S3,S9: 2
S5: 50
S6: 40
S7: 9
S8: 10
S9: 23
S9,S11: 1
安全: 67

5,000+

优质数据集

54 个

任务类型

进入经典数据集