TextVQA Dataset
收藏知名数据集2026-04-23 收录
下载链接:
https://textvqa.org/
下载链接
链接失效反馈官方服务:
资源简介:
TextVQA是由Facebook AI Research团队开发的一个视觉问答数据集,旨在评估模型理解图像中文本并进行推理的能力。该数据集包含来自OpenImages的28,408张图像、45,336个问题和453,360个真实答案,要求模型结合图像中的文本信息来回答问题。作为多模态学习领域的重要基准,TextVQA推动了视觉与语言交叉领域的研究发展,广泛应用于计算机视觉和自然语言处理任务。
提供机构:
Facebook AI Research



