MT-bench

DataCite Commons2024-12-16 更新2025-04-16 收录

下载链接：

https://service.tib.eu/ldmservice/dataset/06ae19aa-add1-4d70-b73d-e73cef522d3e

下载链接

链接失效反馈

官方服务：

资源简介：

The dataset used in the paper is MT-bench, which is an LLM-based automated evaluation metric comprising 80 challenging questions.

该论文所使用的数据集为MT-bench，其是一种基于大语言模型（LLM）的自动化评估指标，包含80道具有挑战性的问题。

提供机构：

TIB

创建时间：

2024-12-16

搜集汇总

背景与挑战

背景概述

MT-bench是一个基于大语言模型的自动评估数据集，包含80个挑战性问题，用于评估模型性能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集