MT-RewardBench
收藏arXiv2025-09-30 收录
下载链接:
https://sabijun.github.io/MT_RewardTreePage/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于评估机器翻译奖励建模中在 token 级别性能的基准。MT-RewardBench 数据集提供了系统性的比较,它将使用纯序列级偏好对训练的模型与使用 token 级偏好对训练的模型进行对比。该任务的焦点是机器翻译。
This dataset is a benchmark for evaluating token-level performance in machine translation reward modeling. The MT-RewardBench dataset provides a systematic comparison between models trained solely with sequence-level preferences and those trained with token-level preferences. The task focuses on machine translation.



