Sanatbek/uzbek-kazakh-parallel-corpora
收藏Hugging Face2023-08-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sanatbek/uzbek-kazakh-parallel-corpora
下载链接
链接失效反馈官方服务:
资源简介:
# To download:
- from datasets import load_dataset
- uz_dev = load_dataset("Sanatbek/uzbek-kazakh-parallel-corpora", split="train[:13373]") (*10%*)
- uz_test = load_dataset("Sanatbek/uzbek-kazakh-parallel-corpora", split="train[13374:40120]") (*20%*)
- uz_train = load_dataset("Sanatbek/uzbek-kazakh-parallel-corpora", split="train[40121:]") (*70%*)
提供机构:
Sanatbek
原始信息汇总
数据集概述
数据集名称
- 名称: Uzbek-Kazakh Parallel Corpora
数据集加载
- 加载方式: 使用
from datasets import load_dataset进行加载。
数据集分割
- 训练集: 占总数据的70%,从数据索引
40121开始。 - 验证集: 占总数据的10%,数据索引范围为
0至13373。 - 测试集: 占总数据的20%,数据索引范围为
13374至40120。



