cornfieldrm/pair-preference-dataset-700K_subset-4-of-4_llama3-8b-it_iter2_conf-0.8
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/cornfieldrm/pair-preference-dataset-700K_subset-4-of-4_llama3-8b-it_iter2_conf-0.8
下载链接
链接失效反馈官方服务:
资源简介:
数据集包含多个特征,如rejected和chosen,每个特征下有content和role等子特征。此外,还有rejected_score、chosen_score、length、chosen_prob和messages等特征。数据集分为train部分,提供了训练数据的大小和数量。推测可能用于评估或训练模型,特别是关于内容选择和角色分配的模型。
数据集包含多个特征,如rejected和chosen,每个特征下有content和role等子特征。此外,还有rejected_score、chosen_score、length、chosen_prob和messages等特征。数据集分为train部分,提供了训练数据的大小和数量。推测可能用于评估或训练模型,特别是关于内容选择和角色分配的模型。
提供机构:
cornfieldrm
原始信息汇总
数据集概述
数据集特征
-
rejected
- content: 数据类型为字符串
- role: 数据类型为字符串
-
rejected_score: 数据类型为浮点数
-
chosen_score: 数据类型为浮点数
-
chosen
- content: 数据类型为字符串
- role: 数据类型为字符串
-
length: 数据类型为整数
-
chosen_prob: 数据类型为浮点数
-
messages
- content: 数据类型为字符串
- role: 数据类型为字符串
数据集划分
- train
- num_bytes: 608017178.187117字节
- num_examples: 94494个样本
数据集大小
- download_size: 350830496字节
- dataset_size: 608017178.187117字节



