Undi95/toxic-dpo-v0.1-sharegpt

Name: Undi95/toxic-dpo-v0.1-sharegpt
Creator: Undi95
Published: 2024-01-15 17:51:27
License: 暂无描述

Hugging Face2024-01-15 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Undi95/toxic-dpo-v0.1-sharegpt

下载链接

链接失效反馈

官方服务：

资源简介：

Toxic-DPO是一个高度有毒、有害的数据集，旨在展示如何使用直接偏好优化（DPO）来轻松去审查/不对齐模型。数据集中的大多数示例仍然包含一些警告/免责声明，因此仍然有些编辑化。使用此数据集需要同意数据集内容的有毒/有害性质，并且仅用于学术/研究或其他非恶意用途。

提供机构：

Undi95

原始信息汇总

数据集概述

Toxic-DPO

这是一个高度有毒、有害的数据集，旨在说明如何使用直接偏好优化（DPO）轻松地去审查/未对齐模型，使用非常少的示例。大多数示例仍然包含一定数量的警告/免责声明，因此仍然在一定程度上进行了编辑。

toxicsharegpt.jsonl：清洁版本，转换为shareGPT格式，仅使用“良好”行。
toxicsharegpt-NoWarning.jsonl：修改版本，删除任何警告（例如：Remember:，However，...），告知用户此行为是非法或不法的，在训练期间审查模型。

使用此数据集必须确认/同意以下内容：

数据包含“有毒”/“有害”内容，包含亵渎和其他类型的敏感内容。
数据集中的内容或观点不一定与个人信仰或观点一致，它们只是由LLMs自动生成的文本（llama-2-70b通过提示工程选择，llama-2-13b-chat-hf用于拒绝）。
您能够合法地使用数据集，特别是在言论自由法律较少的地区。
您，且仅您负责下载和使用数据集，我完全免于任何和所有责任。

此数据集仅限于学术/研究或其他非恶意用途。

5,000+

优质数据集

54 个

任务类型

进入经典数据集