yiyic/Atlatic_tur_mon_kor_cmn_train
收藏Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/yiyic/Atlatic_tur_mon_kor_cmn_train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本数据和语言标识,主要用于训练目的,具有近400万条记录,数据量庞大。
该数据集包含文本数据和语言标识,主要用于训练目的,具有近400万条记录,数据量庞大。
提供机构:
yiyic
原始信息汇总
数据集概述
数据集特征
- text:数据类型为字符串。
- lang:数据类型为字符串。
数据集分割
- train:包含3998000个样本,总大小为17597196510字节。
数据集大小
- 下载大小:9907630036字节。
- 数据集总大小:17597196510字节。
配置
- default:训练数据文件路径为
data/train-*。



