RoleEval
收藏arXiv2024-02-16 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2312.16132v2
下载链接
链接失效反馈官方服务:
资源简介:
RoleEval是一个双语角色评估基准,旨在评估角色知识的记忆、利用和推理能力。它包括全球范围内认可的角色(RoleEval-Global)和中国流行的角色(RoleEval-Chinese),包含6000个中英文平行多项选择题,关注300个有影响力的人物和虚构角色,涵盖名人、动漫、漫画、电影、电视剧、游戏和小说等多个领域。这些问题覆盖了基本知识和多跳推理能力,旨在系统地探究角色的个人信息、关系、能力和经历等各个方面。
创建时间:
2023-12-27



