TextVQA

Name: TextVQA
Creator: OpenDataLab
License: 暂无描述

OpenXLab2026-04-18 收录

下载链接：

https://openxlab.org.cn/datasets/OpenDataLab/TextVQA

下载链接

链接失效反馈

官方服务：

资源简介：

TextVQA 是一个基于图像中的文本对视觉推理进行基准测试的数据集。 TextVQA 要求模型阅读和推理图像中的文本以回答有关它们的问题。具体来说，模型需要在图像中加入一种新的文本形式，并对其进行推理以回答 TextVQA 问题。统计数据 * 来自 OpenImages 的 28,408 张图像 * 45,336 个问题 * 453,360 个真实答案

提供机构：

OpenDataLab

创建时间：

2022-05-30

5,000+

优质数据集

54 个

任务类型

进入经典数据集