five

MT-RewardBench

收藏
arXiv2025-09-30 收录
下载链接:
https://sabijun.github.io/MT_RewardTreePage/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于评估机器翻译奖励建模中在 token 级别性能的基准。MT-RewardBench 数据集提供了系统性的比较,它将使用纯序列级偏好对训练的模型与使用 token 级偏好对训练的模型进行对比。该任务的焦点是机器翻译。

This dataset is a benchmark for evaluating token-level performance in machine translation reward modeling. The MT-RewardBench dataset provides a systematic comparison between models trained solely with sequence-level preferences and those trained with token-level preferences. The task focuses on machine translation.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作