five

APE

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/antoniogois/keystrokes_ape
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了训练自动后编辑(APE)系统所需的三元组:源句子、机器翻译输出以及人工后编辑内容,同时还附有键盘敲击记录特征。该数据集允许与之前在WMT 2016-18 APE共享任务中提交的系统进行比较,使用相同的开发集和测试集。其规模包含23,000个训练样本(其中16,068个与WMT数据集相交),任务是对翻译进行自动后编辑。

This dataset provides the triplets necessary for training automatic post-editing (APE) systems: source sentences, machine translation outputs, and human post-edited content, paired with keyboard keystroke logging features. It allows for direct comparison with systems submitted to the WMT 2016–18 APE Shared Tasks, as it adopts the same development and test sets used in those tasks. The dataset contains 23,000 training samples, 16,068 of which overlap with the WMT dataset, and the core task is automatic post-editing of machine translations.
提供机构:
QT21 project
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作