five

Undi95/toxic-dpo-v0.1-sharegpt

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Undi95/toxic-dpo-v0.1-sharegpt
下载链接
链接失效反馈
官方服务:
资源简介:
Toxic-DPO是一个高度有毒、有害的数据集,旨在展示如何使用直接偏好优化(DPO)来轻松去审查/不对齐模型。数据集中的大多数示例仍然包含一些警告/免责声明,因此仍然有些编辑化。使用此数据集需要同意数据集内容的有毒/有害性质,并且仅用于学术/研究或其他非恶意用途。

Toxic-DPO是一个高度有毒、有害的数据集,旨在展示如何使用直接偏好优化(DPO)来轻松去审查/不对齐模型。数据集中的大多数示例仍然包含一些警告/免责声明,因此仍然有些编辑化。使用此数据集需要同意数据集内容的有毒/有害性质,并且仅用于学术/研究或其他非恶意用途。
提供机构:
Undi95
原始信息汇总

数据集概述

数据集名称

Toxic-DPO

数据集描述

这是一个高度有毒、有害的数据集,旨在说明如何使用直接偏好优化(DPO)轻松地去审查/未对齐模型,使用非常少的示例。大多数示例仍然包含一定数量的警告/免责声明,因此仍然在一定程度上进行了编辑。

数据格式

  • toxicsharegpt.jsonl:清洁版本,转换为shareGPT格式,仅使用“良好”行。
  • toxicsharegpt-NoWarning.jsonl:修改版本,删除任何警告(例如:Remember:,However,...),告知用户此行为是非法或不法的,在训练期间审查模型。

使用限制

使用此数据集必须确认/同意以下内容:

  • 数据包含“有毒”/“有害”内容,包含亵渎和其他类型的敏感内容。
  • 数据集中的内容或观点不一定与个人信仰或观点一致,它们只是由LLMs自动生成的文本(llama-2-70b通过提示工程选择,llama-2-13b-chat-hf用于拒绝)。
  • 您能够合法地使用数据集,特别是在言论自由法律较少的地区。
  • 您,且仅您负责下载和使用数据集,我完全免于任何和所有责任。

适用场景

此数据集仅限于学术/研究或其他非恶意用途。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作