five

MLQE-PE (Multilingual Quality Estimation and Automatic Post-editing Dataset)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MLQE-PE
下载链接
链接失效反馈
官方服务:
资源简介:
多语言质量估计和自动后期编辑数据集。这是MLQE数据集的更新版本,其中包括后期编辑数据以及Ru-En数据。有关生成数据的NMT模型,请参阅MLQE回购。用于生成零镜头语言对翻译的多语言NMT模型可以在这里找到: mBART50 (ps-en和Km-En的多对一,En-Cs和En-Ja的一对多)。

A multilingual quality estimation and automatic post-editing dataset. This is an updated version of the MLQE dataset, which includes post-editing data and Ru-En parallel data. For the NMT models used to generate the dataset, please refer to the MLQE repository. The multilingual NMT models employed to create translations for zero-shot language pairs can be found here: mBART50 (many-to-one for ps-en and Km-En, one-to-many for En-Cs and En-Ja).
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MLQE-PE是一个多语言质量估计和自动后期编辑数据集,作为MLQE的更新版本,新增了后期编辑数据及Ru-En语言对。它基于mBART50等NMT模型生成,支持多种语言对的翻译任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作