unalignment/toxic-dpo-v0.2
收藏Hugging Face2024-01-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/unalignment/toxic-dpo-v0.2
下载链接
链接失效反馈官方服务:
资源简介:
Toxic-DPO是一个高度有毒和有害的数据集,旨在展示如何使用直接偏好优化(DPO)技术轻松地对模型进行去审查或不对齐操作。数据集中的许多示例仍然包含一定数量的警告或免责声明,因此仍然带有一定的编辑性。
Toxic-DPO是一个高度有毒和有害的数据集,旨在展示如何使用直接偏好优化(DPO)技术轻松地对模型进行去审查或不对齐操作。数据集中的许多示例仍然包含一定数量的警告或免责声明,因此仍然带有一定的编辑性。
提供机构:
unalignment



