38万组维汉平行语料数据

Name: 38万组维汉平行语料数据
Creator: 数据堂（北京）科技股份有限公司
Published: 2026-04-28 20:02:46
License: 暂无描述

国家数据集管理服务平台2026-04-28 更新2026-04-29 收录

下载链接：

https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=9663d9cab23bbe1e93f2ed1eae443bba

下载链接

链接失效反馈

官方服务：

资源简介：

38 万维语及其平行对应的汉语文本，并进行数据清洗脱敏质检，可作为文本类数据分析的基础语料库，用于机器翻译等领域。

380,000 Uyghur-Chinese parallel text pairs that have undergone data cleaning, desensitization and quality inspection can serve as a foundational corpus for text-based data analysis and be applied in fields such as machine translation.

提供机构：

数据堂（北京）科技股份有限公司

创建时间：

2026-04-28

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集包含38万组维吾尔语与汉语的平行对应文本，经过清洗、脱敏和质检处理。它适用于机器翻译等文本分析任务，可作为基础语料库用于语音翻译、教育和公共服务领域。

以上内容由遇见数据集搜集并总结生成