mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.00rho0.50

Name: mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.00rho0.50
Creator: mcding-org
Published: 2024-05-20 06:32:03
License: 暂无描述

Hugging Face2024-05-20 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.00rho0.50

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含六个主要特征：提示（prompt）、选择的回答（chosen）、拒绝的回答（rejected）、响应（response）、奖励分数（reward_score）和GPT评分（gpt_score）。数据集分为一个默认的分割，包含2000个例子，总大小为3296649字节，下载大小为1902990字节。

提供机构：

mcding-org

原始信息汇总

数据集概述

数据集配置

配置名称: ab1

数据集特征

prompt: 字符串类型
chosen: 字符串类型
rejected: 字符串类型
response: 字符串类型
reward_score: 浮点数类型（float64）
gpt_score: 浮点数类型（float64）

数据集分割

分割名称: default
数据大小: 3296649字节
示例数量: 2000

数据集大小

下载大小: 1902990字节
数据集总大小: 3296649字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集