中文-阿拉伯语双语翻译数据集
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=683deb0d195d2612331899c6&type=1
下载链接
链接失效反馈官方服务:
资源简介:
中文-阿拉伯语双语翻译数据集包含中文与阿拉伯语的双向翻译数据,由多语言交流平台翻译引擎自动生成。数据经过预处理、领域分类、质量评估以及筛选过滤,最终得到可用于训练中文与阿拉伯语互译模型的半监督双语翻译数据,总计约为1000万行。
提供机构:
鹏城实验室
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个中文与阿拉伯语的双向翻译资源,基于自动翻译引擎生成,并经过预处理、分类和质量筛选。它包含约1000万行半监督双语数据,适用于训练中文-阿拉伯语互译模型。
以上内容由遇见数据集搜集并总结生成



