HumanMT
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/HumanMT
下载链接
链接失效反馈官方服务:
资源简介:
HumanMT 是人工评分和机器翻译更正的集合。它由两部分组成:第一部分包含五分和成对句子级别的评分,第二部分包含错误标记和更正。详情如下所述。 I. 句子级评分这是对 TED 演讲的 1000 个德英机器翻译的五分和成对评分的集合(IWSLT 2014)。收集评级的目的是评估机器翻译质量评级的可靠性和可学习性,以改进具有人工强化的神经机器翻译模型(参见出版物)。二、错误标记和更正这是对 30 个选定的 TED 演讲(IWSLT 2017)的 3120 个英语-德语机器翻译句子的单词级错误标记和后期编辑/更正的集合。每个句子都从人工注释者那里得到更正或错误标记。收集这些数据的目的是比较注释成本和质量,以及注释模式之间下游机器翻译改进的潜力(参见出版物)。
提供机构:
OpenDataLab
创建时间:
2022-05-23



