bz-arc13/fc_rm_train_pair_glaive
收藏Hugging Face2024-07-12 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/bz-arc13/fc_rm_train_pair_glaive
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,如functions、conversation、id、chosen、total_round、round和rejected等。其中,conversation字段是一个列表,包含content、function_call、name和role等子字段。chosen和rejected字段是结构体,包含content、function_call、name和role等子字段。数据集的分割信息显示,数据集只有一个train分割,包含16261个样本,总大小为20585791.86050377字节。
This dataset is primarily used for dialogue systems, containing conversation content, function calls, role information, etc. The dataset is divided into a training set, containing 16261 samples, with a total size of 20585791.86050377 bytes.
提供机构:
bz-arc13
原始信息汇总
数据集概述
数据集信息
特征
- functions: 数据类型为
string - conversation: 包含以下子特征
- content: 数据类型为
string - function_call: 包含以下子特征
- arguments: 数据类型为
string - name: 数据类型为
string
- arguments: 数据类型为
- name: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- id: 数据类型为
string - chosen: 包含以下子特征
- content: 数据类型为
string - function_call: 包含以下子特征
- arguments: 数据类型为
string - name: 数据类型为
string
- arguments: 数据类型为
- name: 数据类型为
null - role: 数据类型为
string
- content: 数据类型为
- total_round: 数据类型为
int64 - round: 数据类型为
int64 - rejected: 包含以下子特征
- content: 数据类型为
string - function_call: 包含以下子特征
- arguments: 数据类型为
string - name: 数据类型为
string
- arguments: 数据类型为
- name: 数据类型为
null - role: 数据类型为
string
- content: 数据类型为
数据集分割
- train: 包含 16261 个样本,占用 20585791.86050377 字节
数据集大小
- 下载大小: 4902851 字节
- 数据集大小: 20585791.86050377 字节
配置
- default: 包含以下数据文件
- train: 路径为
data/train-*
- train: 路径为



