five

RoleEval

收藏
arXiv2024-02-16 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2312.16132v2
下载链接
链接失效反馈
官方服务:
资源简介:
RoleEval是一个双语角色评估基准,旨在评估角色知识的记忆、利用和推理能力。它包括全球范围内认可的角色(RoleEval-Global)和中国流行的角色(RoleEval-Chinese),包含6000个中英文平行多项选择题,关注300个有影响力的人物和虚构角色,涵盖名人、动漫、漫画、电影、电视剧、游戏和小说等多个领域。这些问题覆盖了基本知识和多跳推理能力,旨在系统地探究角色的个人信息、关系、能力和经历等各个方面。
创建时间:
2023-12-27
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作