five

MT-Bench

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MT-Bench
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset contains 3.3K expert-level pairwise human preferences for model responses generated by 6 models in response to 80 MT-bench questions. The 6 models are GPT-4, GPT-3.5, Claud-v1, Vicuna-13B, Alpaca-13B, and LLaMA-13B. The annotators are mostly graduate students with expertise in the topic areas of each of the questions.

本数据集包含3.3千条专家级成对人类偏好标注数据,对应6个模型针对80道MT-bench问题生成的回复。涉及的6个模型分别为GPT-4、GPT-3.5、Claud-v1、Vicuna-13B、Alpaca-13B与LLaMA-13B。标注人员大多为掌握对应问题所属主题领域专业知识的研究生。
提供机构:
OpenDataLab
创建时间:
2024-04-30
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作