alvarobartt/dpo-mix-7k-simplified

Name: alvarobartt/dpo-mix-7k-simplified
Creator: alvarobartt
Published: 2024-03-26 08:23:36
License: 暂无描述

Hugging Face2024-03-26 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/alvarobartt/dpo-mix-7k-simplified

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是`argilla/dpo-mix-7k`的简化版本，通过将`prompt`列与`chosen`和`rejected`列分离，简化了在微调前应用聊天模板的预处理步骤。数据集结合了Argilla在DPO数据集上的最新努力，混合了三个数据集：`argilla/distilabel-capybara-dpo-7k-binarized`、`argilla/distilabel-intel-orca-dpo-pairs`和`argilla/ultrafeedback-binarized-preferences-cleaned`。样本从原始数据集中随机选择，每个数据集的比例为0.33。

提供机构：

alvarobartt

原始信息汇总

数据集概述

数据集结构

特征（features）:
- dataset: 数据集名称，数据类型为字符串（string）。
- prompt: 提示信息，包含以下子字段：
  - content: 内容，数据类型为字符串（string）。
  - role: 角色，数据类型为字符串（string）。
- chosen: 选定内容，包含以下子字段：
  - content: 内容，数据类型为字符串（string）。
  - role: 角色，数据类型为字符串（string）。
- rejected: 拒绝内容，包含以下子字段：
  - content: 内容，数据类型为字符串（string）。
  - role: 角色，数据类型为字符串（string）。

数据集划分（splits）

train: 训练集，包含30,403,251字节，6,750个样本。
test: 测试集，包含3,353,416字节，750个样本。

数据集大小

下载大小: 18,669,181字节。
数据集大小: 33,756,667字节。

配置（configs）

default: 默认配置，包含以下数据文件：
- train: 路径为data/train-*。
- test: 路径为data/test-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集