udmurtNLP/tatoeba-rus-udm-parallel-corpora
收藏Hugging Face2025-01-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/udmurtNLP/tatoeba-rus-udm-parallel-corpora
下载链接
链接失效反馈官方服务:
资源简介:
Udmurt-Russian数据集包含3670个俄语-乌德穆尔特语的句子对,部分句子添加了标点符号。该数据集主要用于翻译任务,数据集的下载时间为2024年2月18日。
提供机构:
udmurtNLP
原始信息汇总
Udmurt-Russian 数据集
概述
- 语言: Udmurt
- 数据量: 1K < n < 10K
- 任务类型: 翻译
数据集信息
- 特征:
rus: 字符串类型udm: 字符串类型source: 字符串类型
- 分割:
train:- 字节数: 347323
- 样本数: 3670
- 下载大小: 168049 字节
- 数据集大小: 347323 字节
配置
- 配置名称: default
- 数据文件:
train: data/train-*
描述
包含 3670 个俄语-Udmurt 句子。部分句子添加了标点符号。数据集于 2024 年 2 月 18 日下载。



