five

StepGame

收藏
arXiv2024-01-09 更新2024-06-21 收录
下载链接:
https://doi.org/10.5518/1468
下载链接
链接失效反馈
官方服务:
资源简介:
StepGame数据集是由利兹大学计算机学院创建,用于评估大型语言模型如ChatGPT在空间推理方面的能力。该数据集包含10000个测试样本,每个样本涉及一个故事和相关问题,旨在通过自然语言描述的空间关系来测试模型的推理能力。数据集的创建过程涉及对故事和问题的精确标注,以确保评估的准确性。StepGame数据集主要应用于AI领域,特别是在提高模型对复杂环境理解的能力,以及增强与用户交互的沉浸式体验。
提供机构:
利兹大学计算机学院,英国
创建时间:
2024-01-09
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作