five

VLM-Perception/RVL-CDIP

收藏
Hugging Face2025-05-17 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/VLM-Perception/RVL-CDIP
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个部分:认知视觉问答(cognition_vqa)、文档分类(document_classification)和推理视觉问答(reasoning_vqa)。每个部分都包括图像、文本消息、答案和相关元信息(如ID和问题类型)。认知视觉问答和推理视觉问答各有400个训练示例,而文档分类也是400个训练示例。数据集支持训练集的下载和实际使用。

The dataset consists of three parts: Cognition Visual Question Answering (cognition_vqa), Document Classification (document_classification), and Reasoning Visual Question Answering (reasoning_vqa). Each part includes images, text messages, answers, and related metadata (such as ID and question type). Both Cognition Visual Question Answering and Reasoning Visual Question Answering have 400 training examples each, and Document Classification also has 400 training examples. The dataset supports the download and actual use of the training set.
提供机构:
VLM-Perception
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作