RLHFlow/Orca-distibalel-standard

Name: RLHFlow/Orca-distibalel-standard
Creator: RLHFlow
Published: 2024-04-28 00:11:00
License: 暂无描述

Hugging Face2024-04-28 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/RLHFlow/Orca-distibalel-standard

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于对话生成任务，特别是用于区分优选和拒绝的对话对。数据集包含两个主要部分：chosen和rejected，每部分都包含content和role两个字段，分别表示对话内容和角色。此外，数据集还包含chosen_score和rejected_score两个字段，用于表示优选和拒绝对话的评分。数据集的大小为23664435.680068433字节，包含6926个训练样本。数据集的来源是argilla/distilabel-intel-orca-dpo-pairs，并且删除了评分相同的对话对。

提供机构：

RLHFlow

原始信息汇总

数据集概述

数据集特征

chosen
- content: 数据类型为字符串
- role: 数据类型为字符串
rejected
- content: 数据类型为字符串
- role: 数据类型为字符串
chosen_score: 数据类型为float64
rejected_score: 数据类型为float64

数据集划分

train
- num_bytes: 23664435.680068433
- num_examples: 6926

数据集大小

download_size: 12516825
dataset_size: 23664435.680068433

配置

config_name: default
- data_files
  - split: train
    - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集