Nexdata/APY230328001_980000_Groups_Chinese_Urdu_Parallel_Corpus_Data

Name: Nexdata/APY230328001_980000_Groups_Chinese_Urdu_Parallel_Corpus_Data
Creator: Nexdata
Published: 2024-04-16 02:04:57
License: 暂无描述

Hugging Face2024-04-16 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Nexdata/APY230328001_980000_Groups_Chinese_Urdu_Parallel_Corpus_Data

下载链接

链接失效反馈

官方服务：

资源简介：

98万对中文和乌尔都语的平行翻译语料，数据存储格式为txt文档。数据经过清洗、脱敏和质量检查，可用作文本数据分析和机器翻译等领域的基础语料。

提供机构：

Nexdata

原始信息汇总

数据集概述

基本信息

数据内容：中文-乌尔都语平行语料库数据
数据规模：0.98百万对中文-乌尔都语平行语料数据
语言：中文、乌尔都语
准确率：90%

存储与格式

存储格式：文本

应用场景

应用场景：机器翻译

数据处理

数据清洗：已完成
数据脱敏：已完成
质量检查：已完成

许可信息

许可证：cc-by-nc-nd-4.0
商业许可：商业许可

5,000+

优质数据集

54 个

任务类型

进入经典数据集