Icannos/distillation_training_1
收藏Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Icannos/distillation_training_1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个英语文本数据集,包含两个主要特征:text(文本内容)和__index_level_0__(索引级别)。数据集包含一个训练集,大小为937,669,951字节,包含5,816,759个样本。下载大小为564,011,497字节,数据集总大小为937,669,951字节。数据文件位于data/train-*路径下。
This dataset is an English text dataset containing two main features: text (text content) and __index_level_0__ (index level). The dataset includes a training set with a size of 937,669,951 bytes, containing 5,816,759 samples. The download size is 564,011,497 bytes, and the total dataset size is 937,669,951 bytes. The data files are located under the path data/train-*.
提供机构:
Icannos
原始信息汇总
数据集概述
语言
- 英文(en)
数据集信息
特征
- text: 数据类型为字符串(string)
- index_level_0: 数据类型为整数(int64)
数据分割
- train:
- 字节数: 937,669,951
- 样本数: 5,816,759
文件大小
- 下载大小: 564,011,497 字节
- 数据集大小: 937,669,951 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



