DocVQA 文档开放式问答数据集

超神经2022-09-27 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/17375

下载链接

链接失效反馈

官方服务：

资源简介：

DocVQA 是一个关于文档图像信息提取的开放式问答数据集。该数据集在对文件结构理解的问题上进行了改进。数据集包含在 12000 多个文件图像上定义了的 5 万个问题。

DocVQA is an open-ended question answering dataset dedicated to document image information extraction. This dataset has been enhanced for tasks related to document structure comprehension. It consists of 50,000 questions defined over more than 12,000 document images.

创建时间：

2022-09-07

搜集汇总

数据集介绍

背景与挑战

背景概述

DocVQA 是一个专注于文档图像信息提取的开放式问答数据集，旨在改进对文件结构的理解。该数据集包含超过12000个文件图像，并定义了5万个相关问题，总大小约为8.3 GB，由社区贡献用于教育和信息目的。

以上内容由遇见数据集搜集并总结生成