five

WMT 2018 News (WMT 2018 News Translation Task)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/WMT_2018_News
下载链接
链接失效反馈
官方服务:
资源简介:
新闻翻译是一项经常性的 WMT 任务。测试集是一组平行语料库,由大约 1500 个英语句子翻译成 5 种语言(中文、捷克语、爱沙尼亚语、德语、芬兰语、俄语、土耳其语)和 7 种语言中的每一种翻译成英语的另外 1500 个句子组成。这些句子选自数十家新闻网站,由专业翻译人员翻译。训练数据包括用于训练翻译模型的并行语料库、用于训练语言模型的单语语料库和用于调优的开发集。一些训练语料库与 WMT 2017 相同(Europarl、Common Crawl、SETIMES2、Yandex 提供的俄英平行数据、CMU 提供的 Wikipedia Headlines),一些是更新的(United Nations、CzEng v1.7、News Commentary v13、单语新闻数据)。此外,还添加了德语、芬兰语和爱沙尼亚语的欧盟新闻稿平行语料库。
提供机构:
OpenDataLab
创建时间:
2022-08-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作