trl-internal-testing/descriptiveness-sentiment-trl-style
收藏Hugging Face2024-04-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/trl-internal-testing/descriptiveness-sentiment-trl-style
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于OpenAI的早期RLHF工作,采用了标准的`prompt, chosen, rejected`格式进行预处理。数据集包含两个分割:descriptiveness和sentiment,分别包含5425和5480个示例,总下载大小为6210965字节,数据集大小为9483850字节。数据集的特征包括prompt、chosen和rejected,其中chosen和rejected分别包含content和role两个字段。
该数据集来源于OpenAI的早期RLHF工作,采用了标准的`prompt, chosen, rejected`格式进行预处理。数据集包含两个分割:descriptiveness和sentiment,分别包含5425和5480个示例,总下载大小为6210965字节,数据集大小为9483850字节。数据集的特征包括prompt、chosen和rejected,其中chosen和rejected分别包含content和role两个字段。
提供机构:
trl-internal-testing
原始信息汇总
数据集概述
数据集结构
- 特征信息:
- prompt:字符串类型
- chosen:列表类型,包含
- content:字符串类型
- role:字符串类型
- rejected:列表类型,包含
- content:字符串类型
- role:字符串类型
数据集分割
- descriptiveness:
- num_bytes:4730435
- num_examples:5425
- sentiment:
- num_bytes:4753415
- num_examples:5480
数据集大小
- download_size:6210965
- dataset_size:9483850
配置信息
- config_name:default
- data_files:
- split:descriptiveness
- path:data/descriptiveness-*
- split:sentiment
- path:data/sentiment-*
- split:descriptiveness
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是OpenAI早期RLHF研究的成果,包含10,905条用于训练语言模型偏好的文本数据,采用prompt-chosen-rejected三元组格式,主要关注文本描述性和情感两个维度。
以上内容由遇见数据集搜集并总结生成



