five

ZhuJiu

收藏
arXiv2023-08-28 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2308.14353v1
下载链接
链接失效反馈
官方服务:
资源简介:
ZhuJiu是一个多维度、多方面的中文基准,用于大型语言模型的全面评估。它覆盖了7个能力维度下的51项任务,特别关注了大型语言模型的知识能力,并采用了3种不同的评估方法以确保评估结果的权威性和准确性。此外,ZhuJiu是首个全面评估中文大型语言模型的基准,同时也提供了同等强大的英文评估能力,并专门为37项任务构建了评估数据以避免潜在的数据泄露问题。
创建时间:
2023-08-28
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作