mcding-org/CorrectDPO-Eval-DPO_Pm3B_U0_beta0.10
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mcding-org/CorrectDPO-Eval-DPO_Pm3B_U0_beta0.10
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: s1
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: response
dtype: string
- name: reward_score
dtype: float64
- name: gpt_score
dtype: float64
splits:
- name: default
num_bytes: 2562630
num_examples: 512
download_size: 1394089
dataset_size: 2562630
- config_name: s2
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: response
dtype: string
- name: reward_score
dtype: float64
- name: gpt_score
dtype: float64
splits:
- name: default
num_bytes: 292180
num_examples: 64
download_size: 184974
dataset_size: 292180
configs:
- config_name: s1
data_files:
- split: default
path: s1/default-*
- config_name: s2
data_files:
- split: default
path: s2/default-*
---
数据集信息:
- 配置名称:s1
特征字段:
- 字段名:提示词(prompt),数据类型:字符串(string)
- 字段名:优选响应(chosen),数据类型:字符串(string)
- 字段名:拒选响应(rejected),数据类型:字符串(string)
- 字段名:模型回复(response),数据类型:字符串(string)
- 字段名:奖励得分(reward_score),数据类型:64位浮点数(float64)
- 字段名:GPT得分(gpt_score),数据类型:64位浮点数(float64)
数据拆分:
- 拆分名称:默认(default),字节占用量:2562630,样本总数:512
下载大小:1394089,数据集总大小:2562630
- 配置名称:s2
特征字段:
- 字段名:提示词(prompt),数据类型:字符串(string)
- 字段名:优选响应(chosen),数据类型:字符串(string)
- 字段名:拒选响应(rejected),数据类型:字符串(string)
- 字段名:模型回复(response),数据类型:字符串(string)
- 字段名:奖励得分(reward_score),数据类型:64位浮点数(float64)
- 字段名:GPT得分(gpt_score),数据类型:64位浮点数(float64)
数据拆分:
- 拆分名称:默认(default),字节占用量:292180,样本总数:64
下载大小:184974,数据集总大小:292180
配置项:
- 配置名称:s1,数据文件:
- 数据拆分:默认(default),文件路径:s1/default-*
- 配置名称:s2,数据文件:
- 数据拆分:默认(default),文件路径:s2/default-*
提供机构:
mcding-org
原始信息汇总
数据集概述
配置 s1
- 特征:
- prompt: 字符串类型
- chosen: 字符串类型
- rejected: 字符串类型
- response: 字符串类型
- reward_score: 浮点数类型
- gpt_score: 浮点数类型
- 分割:
- 名称: default
- 字节数: 2562630
- 示例数: 512
- 下载大小: 1394089
- 数据集大小: 2562630
配置 s2
- 特征:
- prompt: 字符串类型
- chosen: 字符串类型
- rejected: 字符串类型
- response: 字符串类型
- reward_score: 浮点数类型
- gpt_score: 浮点数类型
- 分割:
- 名称: default
- 字节数: 292180
- 示例数: 64
- 下载大小: 184974
- 数据集大小: 292180



