TextVQA
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/TextVQA
下载链接
链接失效反馈官方服务:
资源简介:
TextVQA 是一个基于图像中的文本对视觉推理进行基准测试的数据集。 TextVQA 要求模型阅读和推理图像中的文本以回答有关它们的问题。具体来说,模型需要在图像中加入一种新的文本形式,并对其进行推理以回答 TextVQA 问题。统计数据 * 来自 OpenImages 的 28,408 张图像 * 45,336 个问题 * 453,360 个真实答案
提供机构:
OpenDataLab
创建时间:
2022-05-30



