MT-Bench

Name: MT-Bench
Creator: OpenDataLab
License: 暂无描述

OpenXLab2026-04-18 收录

下载链接：

https://openxlab.org.cn/datasets/OpenDataLab/MT-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

This dataset contains 3.3K expert-level pairwise human preferences for model responses generated by 6 models in response to 80 MT-bench questions. The 6 models are GPT-4, GPT-3.5, Claud-v1, Vicuna-13B, Alpaca-13B, and LLaMA-13B. The annotators are mostly graduate students with expertise in the topic areas of each of the questions.

本数据集包含3.3千条专家级成对人类偏好标注数据，对应6个模型针对80道MT-bench问题生成的回复。涉及的6个模型分别为GPT-4、GPT-3.5、Claud-v1、Vicuna-13B、Alpaca-13B与LLaMA-13B。标注人员大多为掌握对应问题所属主题领域专业知识的研究生。

提供机构：

OpenDataLab

创建时间：

2024-04-30

5,000+

优质数据集

54 个

任务类型

进入经典数据集