Nexdata/Chinese-Korean_Parallel_Corpus_Data
收藏Hugging Face2024-04-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Chinese-Korean_Parallel_Corpus_Data
下载链接
链接失效反馈官方服务:
资源简介:
12,820,000组中韩平行翻译语料库,存储在txt文件中。涵盖了口语、旅游、新闻和金融等多个领域。已进行数据清洗、脱敏和质量检查。可用作文本数据文件中的基础语料库数据库,也可用于机器翻译。
提供机构:
Nexdata
原始信息汇总
数据集卡片 Nexdata/Chinese-Korean_Parallel_Corpus_Data
描述
该数据集包含12,820,000组中韩平行翻译语料,存储在txt文件中。涵盖口语、旅游、新闻和金融等多个领域。数据经过清洗、脱敏和质量检查。可作为文本数据文件的基础语料库,也可用于机器翻译。
规范
存储格式
TXT
数据内容
中韩平行语料数据
数据规模
1282万对中韩平行语料数据。中文句子平均包含25.7个字符。
语言
中文、韩文
准确率
90%
应用场景
机器翻译
许可信息
商业许可证



