OCR-VQA
收藏arXiv2025-09-30 收录
下载链接:
https://ocr-vqa.github.io/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专注于与光学字符识别(OCR)任务相关的视觉问答。它被精选出来,用于评估与OCR相关任务的性能。其主要任务是视觉问答。
This dataset focuses on visual question answering (VQA) tasks related to optical character recognition (OCR). It is curated specifically for evaluating the performance of models on OCR-related tasks, and its core task is visual question answering.
搜集汇总
数据集介绍

背景与挑战
背景概述
OCR-VQA是一个用于视觉问答任务的数据集,专注于通过阅读图像中的文本来回答问题。该数据集由Anand Mishra等人在ICDAR 2019上发表,并提供下载和相关文档支持。
以上内容由遇见数据集搜集并总结生成



