alvarobartt/dpo-mix-7k-simplified
收藏Hugging Face2024-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/dpo-mix-7k-simplified
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是`argilla/dpo-mix-7k`的简化版本,通过将`prompt`列与`chosen`和`rejected`列分离,简化了在微调前应用聊天模板的预处理步骤。数据集结合了Argilla在DPO数据集上的最新努力,混合了三个数据集:`argilla/distilabel-capybara-dpo-7k-binarized`、`argilla/distilabel-intel-orca-dpo-pairs`和`argilla/ultrafeedback-binarized-preferences-cleaned`。样本从原始数据集中随机选择,每个数据集的比例为0.33。
该数据集是`argilla/dpo-mix-7k`的简化版本,通过将`prompt`列与`chosen`和`rejected`列分离,简化了在微调前应用聊天模板的预处理步骤。数据集结合了Argilla在DPO数据集上的最新努力,混合了三个数据集:`argilla/distilabel-capybara-dpo-7k-binarized`、`argilla/distilabel-intel-orca-dpo-pairs`和`argilla/ultrafeedback-binarized-preferences-cleaned`。样本从原始数据集中随机选择,每个数据集的比例为0.33。
提供机构:
alvarobartt
原始信息汇总
数据集概述
数据集结构
- 特征(features):
- dataset: 数据集名称,数据类型为字符串(string)。
- prompt: 提示信息,包含以下子字段:
- content: 内容,数据类型为字符串(string)。
- role: 角色,数据类型为字符串(string)。
- chosen: 选定内容,包含以下子字段:
- content: 内容,数据类型为字符串(string)。
- role: 角色,数据类型为字符串(string)。
- rejected: 拒绝内容,包含以下子字段:
- content: 内容,数据类型为字符串(string)。
- role: 角色,数据类型为字符串(string)。
数据集划分(splits)
- train: 训练集,包含30,403,251字节,6,750个样本。
- test: 测试集,包含3,353,416字节,750个样本。
数据集大小
- 下载大小: 18,669,181字节。
- 数据集大小: 33,756,667字节。
配置(configs)
- default: 默认配置,包含以下数据文件:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。
- train: 路径为



