Pinocchio 匹诺曹事实知识评估数据集
收藏超神经2024-04-11 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/30706
下载链接
链接失效反馈官方服务:
资源简介:
Pinocchio 数据集是由清华大学、伊利诺伊大学芝加哥分校和剑桥大学的研究人员联合创建的,其目的在于全方位评测大型语言模型 (LLMs) 在事实知识存储以及推理能力上的表现。
The Pinocchio Dataset was jointly developed by researchers from Tsinghua University, the University of Illinois Chicago, and the University of Cambridge, with the aim of comprehensively evaluating the performance of Large Language Models (LLMs) in terms of factual knowledge storage and reasoning abilities.
创建时间:
2024-04-10
搜集汇总
数据集介绍

背景与挑战
背景概述
Pinocchio数据集由多所高校联合开发,旨在全面评估大型语言模型的事实知识与推理能力。它包含20,000个多样化的事实问题,通过7项任务测试模型在多事实推理、知识处理及抗干扰等方面的表现。
以上内容由遇见数据集搜集并总结生成



