five

LatEval

收藏
arXiv2024-03-17 更新2024-06-21 收录
下载链接:
https://github.com/THUKElab/LatEval
下载链接
链接失效反馈
官方服务:
资源简介:
LatEval是一个评估大型语言模型横向思维能力的数据集,由清华大学深圳国际研究生院创建。该数据集包含325个高质量样本,来源于多种横向思维谜题网站,涵盖了不完整的故事和真相。创建过程中,通过人工和模型注释筛选和标注关键线索,确保数据集的无害性和挑战性。LatEval旨在通过交互式框架评估模型在提出非传统问题和整合信息以推理真相方面的能力,适用于评估AI助手的横向思维能力。
提供机构:
清华大学深圳国际研究生院
创建时间:
2023-08-22
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
LatEval是一个交互式LLMs评估基准,专注于测试模型在横向思维谜题中的表现,包括提出高质量问题和整合信息进行推理的能力。数据集提供中英文提示模板和评估工具,适用于多种LLMs的测试。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作