DocVQA
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/DocVQA
下载链接
链接失效反馈官方服务:
资源简介:
文档视觉问答 (DocVQA) 旨在激发文档分析和识别研究中的 “目的驱动” 观点,其中文档内容被提取并用于响应由此信息的人类消费者定义的高级任务。为此,我们组织了一系列挑战并发布数据集,以使机器能够 “理解” 文档图像,从而回答有关它们的问题。
数据集中有50 k个问题和12k个图像。图像是从UCSF行业文档库中收集的。问题和答案是手动注释的。
提供机构:
OpenDataLab
创建时间:
2022-11-02



