RLHFlow/SHP-standard
收藏Hugging Face2024-05-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/RLHFlow/SHP-standard
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于stanfordnlp/SHP的训练集,经过筛选保留了比例大于2.0的对话对,并且每个提示最多保留5对对话。数据集包含四个主要特征:rejected(被拒绝的对话)、chosen(被选择的对话)、chosen_score(被选择对话的评分)和rejected_score(被拒绝对话的评分)。每个对话对包含用户和助手的角色信息。数据集仅包含训练集,大小为268473649字节,包含93301个样本。
该数据集来源于stanfordnlp/SHP的训练集,经过筛选保留了比例大于2.0的对话对,并且每个提示最多保留5对对话。数据集包含四个主要特征:rejected(被拒绝的对话)、chosen(被选择的对话)、chosen_score(被选择对话的评分)和rejected_score(被拒绝对话的评分)。每个对话对包含用户和助手的角色信息。数据集仅包含训练集,大小为268473649字节,包含93301个样本。
提供机构:
RLHFlow
原始信息汇总
数据集概述
数据集特征
- rejected
- content: 数据类型为字符串
- role: 数据类型为字符串
- chosen
- content: 数据类型为字符串
- role: 数据类型为字符串
- chosen_score: 数据类型为int64
- rejected_score: 数据类型为int64
数据集划分
- train
- num_bytes: 268473649
- num_examples: 93301
数据集大小
- download_size: 74747359
- dataset_size: 268473649
配置
- config_name: default
- data_files
- split: train
- path: data/train-*
- split: train
- data_files



