five

OCR-VQA

收藏
arXiv2025-09-30 收录
下载链接:
https://ocr-vqa.github.io/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专注于与光学字符识别(OCR)任务相关的视觉问答。它被精选出来,用于评估与OCR相关任务的性能。其主要任务是视觉问答。

This dataset focuses on visual question answering (VQA) tasks related to optical character recognition (OCR). It is curated specifically for evaluating the performance of models on OCR-related tasks, and its core task is visual question answering.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
OCR-VQA是一个用于视觉问答任务的数据集,专注于通过阅读图像中的文本来回答问题。该数据集由Anand Mishra等人在ICDAR 2019上发表,并提供下载和相关文档支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作