HenriCastro/gss_alphaca
收藏Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/HenriCastro/gss_alphaca
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:output、input和instruction,均为字符串类型。数据集仅包含一个训练集,共有8,617,517个样本,总大小为3,570,527,006字节。下载大小为226,945,361字节。数据文件位于data/train-*路径下。
The dataset contains three main features: output, input, and instruction, all of which are of string type. The dataset includes only a training set with 8,617,517 samples, totaling 3,570,527,006 bytes. The download size is 226,945,361 bytes. The data files are located under the path data/train-*.
提供机构:
HenriCastro
原始信息汇总
数据集概述
数据集信息
-
特征:
- output: 数据类型为字符串。
- input: 数据类型为字符串。
- instruction: 数据类型为字符串。
-
数据分割:
- train: 包含8617517个样本,总字节数为3570527006。
-
数据集大小:
- 下载大小: 226945361字节。
- 总大小: 3570527006字节。
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:



