RLHFlow/Orca-distibalel-standard
收藏Hugging Face2024-04-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/RLHFlow/Orca-distibalel-standard
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于对话生成任务,特别是用于区分优选和拒绝的对话对。数据集包含两个主要部分:chosen和rejected,每部分都包含content和role两个字段,分别表示对话内容和角色。此外,数据集还包含chosen_score和rejected_score两个字段,用于表示优选和拒绝对话的评分。数据集的大小为23664435.680068433字节,包含6926个训练样本。数据集的来源是argilla/distilabel-intel-orca-dpo-pairs,并且删除了评分相同的对话对。
该数据集用于对话生成任务,特别是用于区分优选和拒绝的对话对。数据集包含两个主要部分:chosen和rejected,每部分都包含content和role两个字段,分别表示对话内容和角色。此外,数据集还包含chosen_score和rejected_score两个字段,用于表示优选和拒绝对话的评分。数据集的大小为23664435.680068433字节,包含6926个训练样本。数据集的来源是argilla/distilabel-intel-orca-dpo-pairs,并且删除了评分相同的对话对。
提供机构:
RLHFlow
原始信息汇总
数据集概述
数据集特征
- chosen
- content: 数据类型为字符串
- role: 数据类型为字符串
- rejected
- content: 数据类型为字符串
- role: 数据类型为字符串
- chosen_score: 数据类型为float64
- rejected_score: 数据类型为float64
数据集划分
- train
- num_bytes: 23664435.680068433
- num_examples: 6926
数据集大小
- download_size: 12516825
- dataset_size: 23664435.680068433
配置
- config_name: default
- data_files
- split: train
- path: data/train-*
- split: train
- data_files



