38万组维汉平行语料数据
收藏国家数据集管理服务平台2026-04-28 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=9663d9cab23bbe1e93f2ed1eae443bba
下载链接
链接失效反馈官方服务:
资源简介:
38 万维语及其平行对应的汉语文本,并进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。
380,000 Uyghur-Chinese parallel text pairs that have undergone data cleaning, desensitization and quality inspection can serve as a foundational corpus for text-based data analysis and be applied in fields such as machine translation.
提供机构:
数据堂(北京)科技股份有限公司
创建时间:
2026-04-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含38万组维吾尔语与汉语的平行对应文本,经过清洗、脱敏和质检处理。它适用于机器翻译等文本分析任务,可作为基础语料库用于语音翻译、教育和公共服务领域。
以上内容由遇见数据集搜集并总结生成



