wisenut-nlp-team/DPO_train
收藏Hugging Face2025-02-12 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/wisenut-nlp-team/DPO_train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是由三个不同数据集合并而成,分别是maywell/ko_Ultrafeedback_binarized、zzunyang/dpo_data和SJ-Donald/orca-dpo-pairs-ko。总样本数量为98,101条。数据格式为每行包含三个字段:prompt、chosen和rejected。
该数据集是由三个不同数据集合并而成,分别是maywell/ko_Ultrafeedback_binarized、zzunyang/dpo_data和SJ-Donald/orca-dpo-pairs-ko。总样本数量为98,101条。数据格式为每行包含三个字段:prompt、chosen和rejected。
提供机构:
wisenut-nlp-team
原始信息汇总
数据集概述
该数据集是以下三个数据集的合并:
maywell/ko_Ultrafeedback_binarizedzzunyang/dpo_dataSJ-Donald/orca-dpo-pairs-ko
数据集详情
| 数据集名称 | 数据量 |
|---|---|
| ko_Ultrafeedback_binarized | 61,966 |
| dpo_data | 126 |
| orca-dpo-pairs-ko | 36,009 |
| 总计 | 98,101 |
数据格式
所有数据遵循以下格式: Python "prompt" "chosen" "rejected"



