five

trl-internal-testing/descriptiveness-sentiment-trl-style

收藏
Hugging Face2024-04-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/trl-internal-testing/descriptiveness-sentiment-trl-style
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于OpenAI的早期RLHF工作,采用了标准的`prompt, chosen, rejected`格式进行预处理。数据集包含两个分割:descriptiveness和sentiment,分别包含5425和5480个示例,总下载大小为6210965字节,数据集大小为9483850字节。数据集的特征包括prompt、chosen和rejected,其中chosen和rejected分别包含content和role两个字段。

该数据集来源于OpenAI的早期RLHF工作,采用了标准的`prompt, chosen, rejected`格式进行预处理。数据集包含两个分割:descriptiveness和sentiment,分别包含5425和5480个示例,总下载大小为6210965字节,数据集大小为9483850字节。数据集的特征包括prompt、chosen和rejected,其中chosen和rejected分别包含content和role两个字段。
提供机构:
trl-internal-testing
原始信息汇总

数据集概述

数据集结构

  • 特征信息
    • prompt:字符串类型
    • chosen:列表类型,包含
      • content:字符串类型
      • role:字符串类型
    • rejected:列表类型,包含
      • content:字符串类型
      • role:字符串类型

数据集分割

  • descriptiveness
    • num_bytes:4730435
    • num_examples:5425
  • sentiment
    • num_bytes:4753415
    • num_examples:5480

数据集大小

  • download_size:6210965
  • dataset_size:9483850

配置信息

  • config_name:default
  • data_files
    • split:descriptiveness
      • path:data/descriptiveness-*
    • split:sentiment
      • path:data/sentiment-*
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是OpenAI早期RLHF研究的成果,包含10,905条用于训练语言模型偏好的文本数据,采用prompt-chosen-rejected三元组格式,主要关注文本描述性和情感两个维度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作