mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.20rho0.40

Name: mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.20rho0.40
Creator: mcding-org
Published: 2024-05-20 06:45:05
License: 暂无描述

Hugging Face2024-05-20 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/mcding-org/CorrectDPO-Eval-DDP_Q0.5B_PP10_beta0.10r0.20rho0.40

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为ab1，包含六个特征：提示（prompt）、选择的回答（chosen）、拒绝的回答（rejected）、响应（response）、奖励分数（reward_score）和GPT评分（gpt_score）。数据集分为一个默认的split，包含2000个样本，总大小为3311308字节，下载大小为1911494字节。

提供机构：

mcding-org

原始信息汇总

数据集概述

数据集配置

配置名称: ab1

数据集特征

名称: prompt
- 数据类型: string
名称: chosen
- 数据类型: string
名称: rejected
- 数据类型: string
名称: response
- 数据类型: string
名称: reward_score
- 数据类型: float64
名称: gpt_score
- 数据类型: float64

数据集分割

分割名称: default
- 字节数: 3311308
- 示例数: 2000

数据集大小

下载大小: 1911494
数据集大小: 3311308

5,000+

优质数据集

54 个

任务类型

进入经典数据集