1231czx/7b_iter1_pmmistral_v2tokenizer_raft
收藏Hugging Face2024-07-13 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/1231czx/7b_iter1_pmmistral_v2tokenizer_raft
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一系列消息,每条消息由内容和角色两个字段组成,类型均为字符串。数据集仅包含一个训练集,共有17,145个样本,总大小为15,191,357字节。数据文件的默认配置指定了训练集数据的路径。
The dataset contains a series of messages, each consisting of content and role fields, both of which are of string type. The dataset includes only a training set with 17,145 samples, totaling 15,191,357 bytes. The default configuration of the data files specifies the path to the training set data.
提供机构:
1231czx
原始信息汇总
数据集概述
数据集信息
- 特征:
- messages:
- content: 数据类型为字符串
- role: 数据类型为字符串
- messages:
数据分割
- train:
- 数据量: 17145条
- 数据大小: 15191357字节
数据集大小
- 下载大小: 6945176字节
- 数据集总大小: 15191357字节
配置
- default:
- 数据文件路径: data/train-*



