five

wisenut-nlp-team/DPO_train

收藏
Hugging Face2025-02-12 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/wisenut-nlp-team/DPO_train
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是由三个不同数据集合并而成,分别是maywell/ko_Ultrafeedback_binarized、zzunyang/dpo_data和SJ-Donald/orca-dpo-pairs-ko。总样本数量为98,101条。数据格式为每行包含三个字段:prompt、chosen和rejected。

该数据集是由三个不同数据集合并而成,分别是maywell/ko_Ultrafeedback_binarized、zzunyang/dpo_data和SJ-Donald/orca-dpo-pairs-ko。总样本数量为98,101条。数据格式为每行包含三个字段:prompt、chosen和rejected。
提供机构:
wisenut-nlp-team
原始信息汇总

数据集概述

该数据集是以下三个数据集的合并:

  • maywell/ko_Ultrafeedback_binarized
  • zzunyang/dpo_data
  • SJ-Donald/orca-dpo-pairs-ko

数据集详情

数据集名称 数据量
ko_Ultrafeedback_binarized 61,966
dpo_data 126
orca-dpo-pairs-ko 36,009
总计 98,101

数据格式

所有数据遵循以下格式: Python "prompt" "chosen" "rejected"

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作