mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.00rho0.40

Name: mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.00rho0.40
Creator: mcding-org
Published: 2024-05-20 06:28:05
License: 暂无描述

Hugging Face2024-05-20 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.00rho0.40

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，包括prompt（提示）、chosen（选择的回答）、rejected（拒绝的回答）、response（响应）、reward_score（奖励分数）和gpt_score（GPT评分）。数据集的分割为default，包含2000个样本，总大小为3350214字节，下载大小为1932796字节。

提供机构：

mcding-org

原始信息汇总

数据集概述

基本信息

配置名称: ab1

特征信息

prompt: 数据类型为字符串
chosen: 数据类型为字符串
rejected: 数据类型为字符串
response: 数据类型为字符串
reward_score: 数据类型为浮点数（float64）
gpt_score: 数据类型为浮点数（float64）

数据分割

分割名称: default
数据大小: 3350214字节
示例数量: 2000

下载与数据集大小

下载大小: 1932796字节
数据集大小: 3350214字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集