five

alvarobartt/dpo-mix-7k-simplified

收藏
Hugging Face2024-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/dpo-mix-7k-simplified
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是`argilla/dpo-mix-7k`的简化版本,通过将`prompt`列与`chosen`和`rejected`列分离,简化了在微调前应用聊天模板的预处理步骤。数据集结合了Argilla在DPO数据集上的最新努力,混合了三个数据集:`argilla/distilabel-capybara-dpo-7k-binarized`、`argilla/distilabel-intel-orca-dpo-pairs`和`argilla/ultrafeedback-binarized-preferences-cleaned`。样本从原始数据集中随机选择,每个数据集的比例为0.33。

该数据集是`argilla/dpo-mix-7k`的简化版本,通过将`prompt`列与`chosen`和`rejected`列分离,简化了在微调前应用聊天模板的预处理步骤。数据集结合了Argilla在DPO数据集上的最新努力,混合了三个数据集:`argilla/distilabel-capybara-dpo-7k-binarized`、`argilla/distilabel-intel-orca-dpo-pairs`和`argilla/ultrafeedback-binarized-preferences-cleaned`。样本从原始数据集中随机选择,每个数据集的比例为0.33。
提供机构:
alvarobartt
原始信息汇总

数据集概述

数据集结构

  • 特征(features):
    • dataset: 数据集名称,数据类型为字符串(string)。
    • prompt: 提示信息,包含以下子字段:
      • content: 内容,数据类型为字符串(string)。
      • role: 角色,数据类型为字符串(string)。
    • chosen: 选定内容,包含以下子字段:
      • content: 内容,数据类型为字符串(string)。
      • role: 角色,数据类型为字符串(string)。
    • rejected: 拒绝内容,包含以下子字段:
      • content: 内容,数据类型为字符串(string)。
      • role: 角色,数据类型为字符串(string)。

数据集划分(splits)

  • train: 训练集,包含30,403,251字节,6,750个样本。
  • test: 测试集,包含3,353,416字节,750个样本。

数据集大小

  • 下载大小: 18,669,181字节。
  • 数据集大小: 33,756,667字节。

配置(configs)

  • default: 默认配置,包含以下数据文件:
    • train: 路径为data/train-*
    • test: 路径为data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作