five

Trelis/orpo-dpo-mix-40k-SHORT

收藏
Hugging Face2024-05-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Trelis/orpo-dpo-mix-40k-SHORT
下载链接
链接失效反馈
官方服务:
资源简介:
ORPO-DPO-mix-40k数据集是为ORPO或DPO训练设计的,结合了多个高质量的DPO数据集,并进行了规则过滤以去除GPTisms。数据集包含多个特征,如source、chosen、rejected和prompt。此外,数据集中包含一个有毒数据集(toxic-dpo-v0.2),用户可以通过代码过滤掉这部分数据。数据集的历史版本也提供了访问链接。

ORPO-DPO-mix-40k数据集是为ORPO或DPO训练设计的,结合了多个高质量的DPO数据集,并进行了规则过滤以去除GPTisms。数据集包含多个特征,如source、chosen、rejected和prompt。此外,数据集中包含一个有毒数据集(toxic-dpo-v0.2),用户可以通过代码过滤掉这部分数据。数据集的历史版本也提供了访问链接。
提供机构:
Trelis
原始信息汇总

数据集概述

数据集名称

  • ORPO-DPO-mix-40k v1.1

数据集描述

  • 该数据集专为ORPO或DPO训练设计,是一个高质量DPO数据集的组合。

数据集组成

  • 包含多个子数据集,如argilla/Capybara-Preferencesargilla/distilabel-intel-orca-dpo-pairs等,总计约40,000个样本。

数据集特征

  • source: 字符串类型
  • chosen:
    • content: 字符串类型
    • role: 字符串类型
  • rejected:
    • content: 字符串类型
    • role: 字符串类型
  • prompt: 字符串类型

数据集过滤

  • 已过滤掉选择的响应超过2000个字符或最终助手消息超过500个字符的行。

数据集使用

  • 可通过Python代码过滤掉包含非法问题的数据集部分。

数据集版本

  • 提供不同版本的数据集,当前版本为v1.1。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作