ashishkgpian/DPO_training_data
收藏Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ashishkgpian/DPO_training_data
下载链接
链接失效反馈官方服务:
资源简介:
DPO训练数据集是一个用于摘要生成任务的英语数据集,包含36191个训练样本。数据集的特征包括两个提示(prompt_1和prompt_2)、选择的摘要(chosen)和拒绝的摘要(rejected),所有特征均为字符串类型。数据集的总大小为77355040字节,下载大小为33478853字节。
DPO训练数据集是一个用于摘要生成任务的英语数据集,包含36191个训练样本。数据集的特征包括两个提示(prompt_1和prompt_2)、选择的摘要(chosen)和拒绝的摘要(rejected),所有特征均为字符串类型。数据集的总大小为77355040字节,下载大小为33478853字节。
提供机构:
ashishkgpian
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: MIT
- 数据集大小分类: 10K<n<100K
- 任务分类: 摘要生成
- 美观名称: DPO Training Dataset
数据集特征
- 特征列表:
- prompt_1: 字符串类型
- prompt_2: 字符串类型
- chosen: 字符串类型
- rejected: 字符串类型
数据集分割
- 训练集:
- 名称: train
- 字节数: 77355040
- 样本数: 36191
数据集大小
- 下载大小: 33478853
- 数据集大小: 77355040
配置
- 默认配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*



