yleo/emerton_dpo_pairs_judge

Name: yleo/emerton_dpo_pairs_judge
Creator: yleo
Published: 2024-02-14 12:17:28
License: 暂无描述

Hugging Face2024-02-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/yleo/emerton_dpo_pairs_judge

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于对GPT4和GPT4 Turbo的回答进行评判。它是[yleo/emerton_dpo_pairs](https://huggingface.co/datasets/yleo/emerton_dpo_pairs)数据集的评判版本。评判使用了[llm-blender/PairRM](https://huggingface.co/llm-blender/PairRM)工具。建议通过过滤chosen_judge_score > 1来保留显著的差距。

提供机构：

yleo

原始信息汇总

数据集概述

数据集特征

system: 数据类型 - string
input: 数据类型 - string
chosen: 数据类型 - string
rejected: 数据类型 - string
generations: 数据类型 - sequence of string
generation_model: 数据类型 - sequence of string
rating: 数据类型 - sequence of float32
chosen_judge: 数据类型 - string
rejected_judge: 数据类型 - string
chosen_judge_model: 数据类型 - string
rejected_judge_model: 数据类型 - string
rejected_judge_score: 数据类型 - float64
chosen_judge_score: 数据类型 - float64

数据集分割

train:
- 数据量: 38173225 bytes
- 示例数量: 5489

数据集大小

下载大小: 21529431 bytes
数据集大小: 38173225 bytes

配置

config_name: default
data_files:
- split: train
- path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集