TallyQA

arXiv2025-09-30 收录

下载链接：

http://www.manojacharya.com/tallyqa.html

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在评估视觉语言模型（VLM）根据语言描述计数物体的能力。这项任务的类型属于封闭集预测。

This dataset is designed to evaluate the ability of Vision-Language Models (VLMs) to count objects based on linguistic descriptions. The task falls into the category of closed-set prediction.

搜集汇总

数据集介绍

背景与挑战

背景概述

TallyQA是一个大型视觉问答数据集，专注于区分简单和复杂的计数问题，包含287K问题和165K图像，其中19K为复杂问题。该数据集通过设计包含反例的问题，确保复杂问题的质量，是2018年最大的开放式计数VQA数据集。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集