five

TextVQA

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/TextVQA
下载链接
链接失效反馈
官方服务:
资源简介:
TextVQA 是一个基于图像中的文本对视觉推理进行基准测试的数据集。 TextVQA 要求模型阅读和推理图像中的文本以回答有关它们的问题。具体来说,模型需要在图像中加入一种新的文本形式,并对其进行推理以回答 TextVQA 问题。统计数据 * 来自 OpenImages 的 28,408 张图像 * 45,336 个问题 * 453,360 个真实答案
提供机构:
OpenDataLab
创建时间:
2022-05-30
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作