AigizK/tatar-russian-parallel-corpora
收藏Hugging Face2023-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AigizK/tatar-russian-parallel-corpora
下载链接
链接失效反馈官方服务:
资源简介:
这是一个塔塔尔语-俄语的平行语料库,包含161831个样本,主要用于训练目的。数据集包含两个字段:tat(塔塔尔语)和rus(俄语),均为字符串类型。
这是一个塔塔尔语-俄语的平行语料库,包含161831个样本,主要用于训练目的。数据集包含两个字段:tat(塔塔尔语)和rus(俄语),均为字符串类型。
提供机构:
AigizK
原始信息汇总
数据集概述
数据特征
- tat: 类型为字符串
- rus: 类型为字符串
数据分割
- train:
- 字节数: 60268429
- 样本数: 161831
数据大小
- 下载大小: 29541597
- 数据集大小: 60268429
配置
- default:
- 数据文件路径: data/train-*



