five

nixon0630/hamza_1.0

收藏
Hugging Face2023-12-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nixon0630/hamza_1.0
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit task_categories: - translation language: - uz - ru pretty_name: uzbek-russian_parallel_corpora --- # Hamza - Uzbek-Russian parallel corpora. ## Overview **Hamza** is a parallel corpus containing over 15,000 aligned sentences in Uzbek and Russian. ## Creation Created using [lingtrain](https://github.com/averkij/lingtrain-aligner). Text mined from different websites and telegram channels. ### Format The dataset is presented in TMX (Translation Memory eXchange).
提供机构:
nixon0630
原始信息汇总

Hamza - Uzbek-Russian 平行语料库

概述

Hamza 是一个包含超过 15,000 对乌兹别克语和俄语对齐句子的平行语料库。

创建

使用 lingtrain 创建。从不同网站和 Telegram 频道挖掘文本。

格式

数据集以 TMX(Translation Memory eXchange)格式呈现。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作