中韩平行语料数据【数据堂】

Name: 中韩平行语料数据【数据堂】
Creator: shujutang
Published: 2023-08-10 17:06:45
License: 暂无描述

OpenDataLab2023-08-10 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/shujutang/shujutang_NexData09

下载链接

链接失效反馈

官方服务：

资源简介：

1282万组中韩平行互译语料，数据存储格式为txt文档，覆盖口语、旅游、新闻、金融等多个领域。已进行数据清洗脱敏质检，可作为文本类数据分析的基础语料库，用于机器翻译等领域。

12.82 million pairs of Chinese-Korean parallel translation corpora are stored in TXT documents, covering multiple domains including spoken language, tourism, news, finance and other fields. The dataset has undergone data cleaning, de-identification and quality inspection, and can be used as a foundational corpus for text data analysis, with applications in machine translation and other relevant domains.

提供机构：

shujutang

创建时间：

2023-08-10

搜集汇总

数据集介绍