mcding-org/CorrectDPO-Eval-DDP_L8B_U0_beta0.10r0.30rho0.20
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mcding-org/CorrectDPO-Eval-DDP_L8B_U0_beta0.10r0.30rho0.20
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
config_name: m1
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: response
dtype: string
- name: reward_score
dtype: float64
- name: gpt_score
dtype: float64
splits:
- name: default
num_bytes: 276939
num_examples: 64
download_size: 176218
dataset_size: 276939
configs:
- config_name: m1
data_files:
- split: default
path: m1/default-*
---
提供机构:
mcding-org
原始信息汇总
数据集信息
配置名称
m1
特征
prompt: 字符串类型chosen: 字符串类型rejected: 字符串类型response: 字符串类型reward_score: 浮点数类型 (float64)gpt_score: 浮点数类型 (float64)
数据分割
default:- 字节数: 276939
- 样本数: 64
数据大小
- 下载大小: 176218
- 数据集大小: 276939
配置详情
- 配置名称:
m1 - 数据文件:
- 分割:
default - 路径:
m1/default-*
- 分割:



