honggen/hh_extend_chatgpt
收藏Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/honggen/hh_extend_chatgpt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集最初来自一篇论文,作者将其格式更改为与hh-rlhf数据集匹配。原始数据中每个提示有三个响应,并且已经根据奖励(基于大型LLM计算)进行了排名。作者将其转换为成对数据,生成了(1,2)、(1,3)和(2,3)三对数据。此外,作者还计算了成对数据的奖励差异和基于BERT的相似度。
该数据集最初来自一篇论文,作者将其格式更改为与hh-rlhf数据集匹配。原始数据中每个提示有三个响应,并且已经根据奖励(基于大型LLM计算)进行了排名。作者将其转换为成对数据,生成了(1,2)、(1,3)和(2,3)三对数据。此外,作者还计算了成对数据的奖励差异和基于BERT的相似度。
提供机构:
honggen
原始信息汇总
数据集概述
许可协议
- 本数据集遵循Apache-2.0许可协议。
任务类别
- 数据集主要用于文本生成任务。
语言
- 数据集语言为英语。
数据处理
- 原始数据为每条提示提供三个响应,并已根据奖励(基于大型语言模型计算)进行排名。
- 数据集被转换为成对数据,包括(1,2)、(1,3)和(2,3)三对。
- 计算了每对数据之间的奖励差异和基于BERT的相似度。



