five

TOMCHALLENGES

收藏
arXiv2023-10-24 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2305.15068v2
下载链接
链接失效反馈
官方服务:
资源简介:
TOMCHALLENGES数据集由认知、大脑与语言巴斯克中心创建,旨在通过多样化的任务全面评估大型语言模型的心智理论能力。该数据集基于Sally-Anne和Smarties测试,包含30个变体,每个变体涉及6种不同类型的问题,用以考察模型对现实、信念、第一和第二阶信念的理解。数据集的创建过程遵循心理学和语言学的严格评估标准,确保其有效性和可靠性。应用领域主要集中在人工智能的心智理论评估,特别是解决大型语言模型在心智理论任务上的表现和局限性。
提供机构:
认知、大脑与语言巴斯克中心
创建时间:
2023-05-24
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作