five

alignbench

收藏
魔搭社区2025-12-05 更新2025-06-28 收录
下载链接:
https://modelscope.cn/datasets/jaskwwy/alignbench
下载链接
链接失效反馈
官方服务:
资源简介:
AlignBench 是第一个多维度全面评估中文大模型对齐水平的评测基准。

AlignBench is the first multi-dimensional and comprehensive benchmark for evaluating the alignment capabilities of Chinese large language models.
提供机构:
maas
创建时间:
2025-06-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AlignBench 是首个用于全面评估中文大模型在多个维度上对齐水平的基准数据集,旨在通过真实用户查询和挑战性问题来反映模型在实际应用中的性能。它包含 683 个高质量数据点,涵盖语言能力、逻辑推理、专业知识等 8 个主要类别,并采用自动化评估方法增强可靠性和可解释性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作