five

HumanMT

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/HumanMT
下载链接
链接失效反馈
官方服务:
资源简介:
HumanMT 是人工评分和机器翻译更正的集合。它由两部分组成:第一部分包含五分和成对句子级别的评分,第二部分包含错误标记和更正。详情如下所述。 I. 句子级评分这是对 TED 演讲的 1000 个德英机器翻译的五分和成对评分的集合(IWSLT 2014)。收集评级的目的是评估机器翻译质量评级的可靠性和可学习性,以改进具有人工强化的神经机器翻译模型(参见出版物)。二、错误标记和更正这是对 30 个选定的 TED 演讲(IWSLT 2017)的 3120 个英语-德语机器翻译句子的单词级错误标记和后期编辑/更正的集合。每个句子都从人工注释者那里得到更正或错误标记。收集这些数据的目的是比较注释成本和质量,以及注释模式之间下游机器翻译改进的潜力(参见出版物)。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HumanMT是一个包含人工评分和机器翻译更正的数据集,分为两部分:第一部分收集了1000个德英机器翻译句子的评分,用于评估翻译质量;第二部分包含3120个英德句子的错误标记和更正,旨在比较注释模式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作