ZhuJiu
收藏arXiv2023-08-28 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2308.14353v1
下载链接
链接失效反馈官方服务:
资源简介:
ZhuJiu是一个多维度、多方面的中文基准,用于大型语言模型的全面评估。它覆盖了7个能力维度下的51项任务,特别关注了大型语言模型的知识能力,并采用了3种不同的评估方法以确保评估结果的权威性和准确性。此外,ZhuJiu是首个全面评估中文大型语言模型的基准,同时也提供了同等强大的英文评估能力,并专门为37项任务构建了评估数据以避免潜在的数据泄露问题。
创建时间:
2023-08-28



