five

United Nations Parallel Corpus

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/United_Nations_Parallel_Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
联合国平行语料库(UNPC)是由联合国官方记录和其他会议文件组成的六个平行语料库的集合。大多数文件以联合国所有六种正式语文提供。语料库的内容由 1990 年至 2014 年之间的人工翻译文档组成,文本在句子级别上对齐。 UNPC 语料库中的语言列表包括:阿拉伯文、中文(简体)、英文、法文、俄文和西班牙文。

The United Nations Parallel Corpus (UNPC) is a collection of six parallel corpora composed of official United Nations records and other conference documents. Most documents are available in all six official languages of the United Nations. The corpus consists of manually translated documents from 1990 to 2014, with texts aligned at the sentence level. The languages included in the UNPC are: Arabic, Chinese (Simplified), English, French, Russian, and Spanish.
提供机构:
OpenDataLab
创建时间:
2022-05-30
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
联合国平行语料库是一个由联合国官方记录和会议文件组成的多语言平行语料库集合,支持阿拉伯文、中文、英文、法文、俄文和西班牙文六种语言,文本在句子级别对齐。该语料库包含1990年至2014年的人工翻译文档,适用于机器翻译和自然语言处理研究,由学术机构于2016年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作