Nexdata/380000_Groups_Uighur_Chinese_Parallel_Corpus_Data
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/380000_Groups_Uighur_Chinese_Parallel_Corpus_Data
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含维吾尔语和汉语平行文本的数据集,共有38,000组数据,经过清洗、脱敏和质量检查,适用于机器翻译及相关领域的文本数据分析。
这是一个包含维吾尔语和汉语平行文本的数据集,共有38,000组数据,经过清洗、脱敏和质量检查,适用于机器翻译及相关领域的文本数据分析。
提供机构:
Nexdata
原始信息汇总
数据集概述
描述
- 数据类型: Uighur语言及其对应的平行中文文本数据
- 数据量: 总计38,000组
- 处理状态: 已清洗、去敏化和通过质量检查
- 应用领域: 可作为机器翻译及相关领域的文本数据分析基础语料库
规格
- 存储格式: TXT
- 数据内容: Uighur-Chinese平行语料库数据
- 数据大小: 0.38百万对Uighur-Chinese平行语料库数据
- 语言: Uighur, Chinese
- 应用场景: 机器翻译
许可信息
- 许可证: 商业许可证
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



