five

CausalMT

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/EdisonNi-hku/CausalMT
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了大量由人类标记翻译方向的翻译对,使得研究者能够探究训练测试方向匹配以及数据模型方向匹配对机器翻译性能的影响。此外,该数据集还允许分析翻译文本与自然写作文本在词汇量及冗余性等方面的翻译特征。具体规模上,该数据集涵盖了三个训练集内超过20万对翻译对,两个训练集内超过9万对翻译对,以及一个包含1,000对翻译对的开发集和一个包含2,000对翻译对的测试集。该数据集的任务是用于机器翻译研究。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作