Undi95/toxic-dpo-v0.1-sharegpt
收藏Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Undi95/toxic-dpo-v0.1-sharegpt
下载链接
链接失效反馈官方服务:
资源简介:
Toxic-DPO是一个高度有毒、有害的数据集,旨在展示如何使用直接偏好优化(DPO)来轻松去审查/不对齐模型。数据集中的大多数示例仍然包含一些警告/免责声明,因此仍然有些编辑化。使用此数据集需要同意数据集内容的有毒/有害性质,并且仅用于学术/研究或其他非恶意用途。
Toxic-DPO是一个高度有毒、有害的数据集,旨在展示如何使用直接偏好优化(DPO)来轻松去审查/不对齐模型。数据集中的大多数示例仍然包含一些警告/免责声明,因此仍然有些编辑化。使用此数据集需要同意数据集内容的有毒/有害性质,并且仅用于学术/研究或其他非恶意用途。
提供机构:
Undi95
原始信息汇总
数据集概述
数据集名称
Toxic-DPO
数据集描述
这是一个高度有毒、有害的数据集,旨在说明如何使用直接偏好优化(DPO)轻松地去审查/未对齐模型,使用非常少的示例。大多数示例仍然包含一定数量的警告/免责声明,因此仍然在一定程度上进行了编辑。
数据格式
toxicsharegpt.jsonl:清洁版本,转换为shareGPT格式,仅使用“良好”行。toxicsharegpt-NoWarning.jsonl:修改版本,删除任何警告(例如:Remember:,However,...),告知用户此行为是非法或不法的,在训练期间审查模型。
使用限制
使用此数据集必须确认/同意以下内容:
- 数据包含“有毒”/“有害”内容,包含亵渎和其他类型的敏感内容。
- 数据集中的内容或观点不一定与个人信仰或观点一致,它们只是由LLMs自动生成的文本(llama-2-70b通过提示工程选择,llama-2-13b-chat-hf用于拒绝)。
- 您能够合法地使用数据集,特别是在言论自由法律较少的地区。
- 您,且仅您负责下载和使用数据集,我完全免于任何和所有责任。
适用场景
此数据集仅限于学术/研究或其他非恶意用途。



