Trelis/orpo-dpo-mix-40k-SHORT
收藏Hugging Face2024-05-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Trelis/orpo-dpo-mix-40k-SHORT
下载链接
链接失效反馈官方服务:
资源简介:
ORPO-DPO-mix-40k数据集是为ORPO或DPO训练设计的,结合了多个高质量的DPO数据集,并进行了规则过滤以去除GPTisms。数据集包含多个特征,如source、chosen、rejected和prompt。此外,数据集中包含一个有毒数据集(toxic-dpo-v0.2),用户可以通过代码过滤掉这部分数据。数据集的历史版本也提供了访问链接。
ORPO-DPO-mix-40k数据集是为ORPO或DPO训练设计的,结合了多个高质量的DPO数据集,并进行了规则过滤以去除GPTisms。数据集包含多个特征,如source、chosen、rejected和prompt。此外,数据集中包含一个有毒数据集(toxic-dpo-v0.2),用户可以通过代码过滤掉这部分数据。数据集的历史版本也提供了访问链接。
提供机构:
Trelis
原始信息汇总
数据集概述
数据集名称
- ORPO-DPO-mix-40k v1.1
数据集描述
- 该数据集专为ORPO或DPO训练设计,是一个高质量DPO数据集的组合。
数据集组成
- 包含多个子数据集,如
argilla/Capybara-Preferences、argilla/distilabel-intel-orca-dpo-pairs等,总计约40,000个样本。
数据集特征
- source: 字符串类型
- chosen:
- content: 字符串类型
- role: 字符串类型
- rejected:
- content: 字符串类型
- role: 字符串类型
- prompt: 字符串类型
数据集过滤
- 已过滤掉选择的响应超过2000个字符或最终助手消息超过500个字符的行。
数据集使用
- 可通过Python代码过滤掉包含非法问题的数据集部分。
数据集版本
- 提供不同版本的数据集,当前版本为v1.1。



