bobby-nakamoto/zangiyev_ar
收藏Hugging Face2024-07-12 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/bobby-nakamoto/zangiyev_ar
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要字段:id和text,其中id为字符串类型,text也为字符串类型。数据集被分为一个训练集,包含126,199,432个示例,总大小为32,094,236,006字节。数据集的下载大小为16,360,165,105字节。配置信息指定了默认配置下的数据文件路径。
The dataset contains two main fields: id and text, both of which are of string type. The dataset is divided into a training set, which includes 126,199,432 examples with a total size of 32,094,236,006 bytes. The download size of the dataset is 16,360,165,105 bytes. Configuration information specifies the path of data files under the default configuration.
提供机构:
bobby-nakamoto
原始信息汇总
数据集概述
数据集信息
- 特征:
id: 类型为字符串text: 类型为字符串
数据分割
- 训练集:
- 名称:
train - 字节数: 32,094,236,006
- 样本数: 126,199,432
- 名称:
数据集大小
- 下载大小: 16,360,165,105 字节
- 数据集总大小: 32,094,236,006 字节
配置
- 配置名称:
default - 数据文件:
- 分割:
train - 路径:
data/train-*
- 分割:



