yleo/emerton_dpo_pairs_judge
收藏Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yleo/emerton_dpo_pairs_judge
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于对GPT4和GPT4 Turbo的回答进行评判。它是[yleo/emerton_dpo_pairs](https://huggingface.co/datasets/yleo/emerton_dpo_pairs)数据集的评判版本。评判使用了[llm-blender/PairRM](https://huggingface.co/llm-blender/PairRM)工具。建议通过过滤chosen_judge_score > 1来保留显著的差距。
该数据集用于对GPT4和GPT4 Turbo的回答进行评判。它是[yleo/emerton_dpo_pairs](https://huggingface.co/datasets/yleo/emerton_dpo_pairs)数据集的评判版本。评判使用了[llm-blender/PairRM](https://huggingface.co/llm-blender/PairRM)工具。建议通过过滤chosen_judge_score > 1来保留显著的差距。
提供机构:
yleo
原始信息汇总
数据集概述
数据集特征
- system: 数据类型 - string
- input: 数据类型 - string
- chosen: 数据类型 - string
- rejected: 数据类型 - string
- generations: 数据类型 - sequence of string
- generation_model: 数据类型 - sequence of string
- rating: 数据类型 - sequence of float32
- chosen_judge: 数据类型 - string
- rejected_judge: 数据类型 - string
- chosen_judge_model: 数据类型 - string
- rejected_judge_model: 数据类型 - string
- rejected_judge_score: 数据类型 - float64
- chosen_judge_score: 数据类型 - float64
数据集分割
- train:
- 数据量: 38173225 bytes
- 示例数量: 5489
数据集大小
- 下载大小: 21529431 bytes
- 数据集大小: 38173225 bytes
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



