five

Nexdata/380000_Groups_Uighur_Chinese_Parallel_Corpus_Data

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/380000_Groups_Uighur_Chinese_Parallel_Corpus_Data
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含维吾尔语和汉语平行文本的数据集,共有38,000组数据,经过清洗、脱敏和质量检查,适用于机器翻译及相关领域的文本数据分析。

这是一个包含维吾尔语和汉语平行文本的数据集,共有38,000组数据,经过清洗、脱敏和质量检查,适用于机器翻译及相关领域的文本数据分析。
提供机构:
Nexdata
原始信息汇总

数据集概述

描述

  • 数据类型: Uighur语言及其对应的平行中文文本数据
  • 数据量: 总计38,000组
  • 处理状态: 已清洗、去敏化和通过质量检查
  • 应用领域: 可作为机器翻译及相关领域的文本数据分析基础语料库

规格

  • 存储格式: TXT
  • 数据内容: Uighur-Chinese平行语料库数据
  • 数据大小: 0.38百万对Uighur-Chinese平行语料库数据
  • 语言: Uighur, Chinese
  • 应用场景: 机器翻译

许可信息

  • 许可证: 商业许可证
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作