wisenut-nlp-team/DPO_train

Name: wisenut-nlp-team/DPO_train
Creator: wisenut-nlp-team
Published: 2025-02-12 07:45:50
License: 暂无描述

Hugging Face2025-02-12 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/wisenut-nlp-team/DPO_train

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是由三个不同数据集合并而成，分别是maywell/ko_Ultrafeedback_binarized、zzunyang/dpo_data和SJ-Donald/orca-dpo-pairs-ko。总样本数量为98,101条。数据格式为每行包含三个字段：prompt、chosen和rejected。

提供机构：

wisenut-nlp-team

原始信息汇总

数据集概述

该数据集是以下三个数据集的合并：

maywell/ko_Ultrafeedback_binarized
zzunyang/dpo_data
SJ-Donald/orca-dpo-pairs-ko

数据集详情

数据集名称	数据量
ko_Ultrafeedback_binarized	61,966
dpo_data	126
orca-dpo-pairs-ko	36,009
总计	98,101

数据格式

所有数据遵循以下格式： Python "prompt" "chosen" "rejected"

5,000+

优质数据集

54 个

任务类型

进入经典数据集