eitanturok/glaive-fc-v2-chatml-clean
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/eitanturok/glaive-fc-v2-chatml-clean
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: no-tools
features:
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 77364163.34989141
num_examples: 34598
download_size: 66960381
dataset_size: 77364163.34989141
- config_name: tools
features:
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 170758839.6501086
num_examples: 76365
download_size: 23323167
dataset_size: 170758839.6501086
configs:
- config_name: no-tools
data_files:
- split: train
path: no-tools/train-*
- config_name: tools
data_files:
- split: train
path: tools/train-*
---
数据集信息如下:
- 配置名称为无工具(no-tools):
特征字段:
- 字段messages为列表类型,列表内包含两个子字段:
- content:数据类型为字符串(string)
- role:数据类型为字符串(string)
数据集拆分:
- 训练拆分(train):字节占用量为77364163.34989141,样本数量为34598
该配置的下载大小为66960381,数据集总大小为77364163.34989141
- 配置名称为带工具(tools):
特征字段:
- 字段messages为列表类型,列表内包含两个子字段:
- content:数据类型为字符串(string)
- role:数据类型为字符串(string)
数据集拆分:
- 训练拆分(train):字节占用量为170758839.6501086,样本数量为76365
该配置的下载大小为23323167,数据集总大小为170758839.6501086
配置列表:
- 配置名称为无工具(no-tools):对应训练拆分的数据文件路径为 no-tools/train-*
- 配置名称为带工具(tools):对应训练拆分的数据文件路径为 tools/train-*
提供机构:
eitanturok
原始信息汇总
数据集概述
配置名称:no-tools
- 特征信息:
- 名称:messages
- 子特征:
- 名称:content
- 数据类型:string
- 名称:role
- 数据类型:string
- 名称:content
- 子特征:
- 名称:messages
- 数据分割:
- 分割名称:train
- 数据大小:77364163.34989141字节
- 示例数量:34598
- 分割名称:train
- 下载大小: 66960381字节
- 数据集大小: 77364163.34989141字节
配置名称:tools
- 特征信息:
- 名称:messages
- 子特征:
- 名称:content
- 数据类型:string
- 名称:role
- 数据类型:string
- 名称:content
- 子特征:
- 名称:messages
- 数据分割:
- 分割名称:train
- 数据大小:170758839.6501086字节
- 示例数量:76365
- 分割名称:train
- 下载大小: 23323167字节
- 数据集大小: 170758839.6501086字节



