five

Pinocchio 匹诺曹事实知识评估数据集

收藏
超神经2024-04-11 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/30706
下载链接
链接失效反馈
官方服务:
资源简介:
Pinocchio 数据集是由清华大学、伊利诺伊大学芝加哥分校和剑桥大学的研究人员联合创建的,其目的在于全方位评测大型语言模型 (LLMs) 在事实知识存储以及推理能力上的表现。

The Pinocchio Dataset was jointly developed by researchers from Tsinghua University, the University of Illinois Chicago, and the University of Cambridge, with the aim of comprehensively evaluating the performance of Large Language Models (LLMs) in terms of factual knowledge storage and reasoning abilities.
创建时间:
2024-04-10
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Pinocchio数据集由多所高校联合开发,旨在全面评估大型语言模型的事实知识与推理能力。它包含20,000个多样化的事实问题,通过7项任务测试模型在多事实推理、知识处理及抗干扰等方面的表现。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务