alignbench
收藏魔搭社区2025-12-05 更新2025-06-28 收录
下载链接:
https://modelscope.cn/datasets/jaskwwy/alignbench
下载链接
链接失效反馈官方服务:
资源简介:
AlignBench 是第一个多维度全面评估中文大模型对齐水平的评测基准。
AlignBench is the first multi-dimensional and comprehensive benchmark for evaluating the alignment capabilities of Chinese large language models.
提供机构:
maas
创建时间:
2025-06-23
搜集汇总
数据集介绍

背景与挑战
背景概述
AlignBench 是首个用于全面评估中文大模型在多个维度上对齐水平的基准数据集,旨在通过真实用户查询和挑战性问题来反映模型在实际应用中的性能。它包含 683 个高质量数据点,涵盖语言能力、逻辑推理、专业知识等 8 个主要类别,并采用自动化评估方法增强可靠性和可解释性。
以上内容由遇见数据集搜集并总结生成



