nixon0630/hamza_1.0
收藏Hugging Face2023-12-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nixon0630/hamza_1.0
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- translation
language:
- uz
- ru
pretty_name: uzbek-russian_parallel_corpora
---
# Hamza - Uzbek-Russian parallel corpora.
## Overview
**Hamza** is a parallel corpus containing over 15,000 aligned sentences in Uzbek and Russian.
## Creation
Created using [lingtrain](https://github.com/averkij/lingtrain-aligner). Text mined from different websites and telegram channels.
### Format
The dataset is presented in TMX (Translation Memory eXchange).
提供机构:
nixon0630
原始信息汇总
Hamza - Uzbek-Russian 平行语料库
概述
Hamza 是一个包含超过 15,000 对乌兹别克语和俄语对齐句子的平行语料库。
创建
使用 lingtrain 创建。从不同网站和 Telegram 频道挖掘文本。
格式
数据集以 TMX(Translation Memory eXchange)格式呈现。



