AlignBench

Name: AlignBench
Creator: AlignBench
License: 暂无描述

arXiv2025-09-30 收录

下载链接：

https://github.com/thudm/alignbench

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个衡量大型语言模型（LLM）与中文人类指令对齐度的基准数据集，其中包含了针对生成文本的人类标注评估数据。该数据集不仅包含了评估指标和人工标注，而且训练集和测试集之间没有重叠。规模上，它包含了250个用户查询，每个指令下有来自8个不同LLM生成的文本。该数据集的任务是评估大型语言模型生成文本的质量。

提供机构：

AlignBench

5,000+

优质数据集

54 个

任务类型

进入经典数据集