bz-arc13/fc_rm_train_pair_glaive

Name: bz-arc13/fc_rm_train_pair_glaive
Creator: bz-arc13
Published: 2024-07-12 02:17:05
License: 暂无描述

Hugging Face2024-07-12 更新2024-07-13 收录

下载链接：

https://hf-mirror.com/datasets/bz-arc13/fc_rm_train_pair_glaive

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个字段，如functions、conversation、id、chosen、total_round、round和rejected等。其中，conversation字段是一个列表，包含content、function_call、name和role等子字段。chosen和rejected字段是结构体，包含content、function_call、name和role等子字段。数据集的分割信息显示，数据集只有一个train分割，包含16261个样本，总大小为20585791.86050377字节。

This dataset is primarily used for dialogue systems, containing conversation content, function calls, role information, etc. The dataset is divided into a training set, containing 16261 samples, with a total size of 20585791.86050377 bytes.

提供机构：

bz-arc13

原始信息汇总

数据集概述

数据集信息

特征

functions: 数据类型为 string
conversation: 包含以下子特征
- content: 数据类型为 string
- function_call: 包含以下子特征
  - arguments: 数据类型为 string
  - name: 数据类型为 string
- name: 数据类型为 string
- role: 数据类型为 string
id: 数据类型为 string
chosen: 包含以下子特征
- content: 数据类型为 string
- function_call: 包含以下子特征
  - arguments: 数据类型为 string
  - name: 数据类型为 string
- name: 数据类型为 null
- role: 数据类型为 string
total_round: 数据类型为 int64
round: 数据类型为 int64
rejected: 包含以下子特征
- content: 数据类型为 string
- function_call: 包含以下子特征
  - arguments: 数据类型为 string
  - name: 数据类型为 string
- name: 数据类型为 null
- role: 数据类型为 string

数据集分割

train: 包含 16261 个样本，占用 20585791.86050377 字节

数据集大小

下载大小: 4902851 字节
数据集大小: 20585791.86050377 字节

配置

default: 包含以下数据文件
- train: 路径为 data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集