dddraxxx/ocr_vqa
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/dddraxxx/ocr_vqa
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是LLaVAv1.5的训练数据集之一,包含图像、图像ID、图像URL、问题、答案、标题、作者姓名和类型等特征。数据集分为训练集、验证集和测试集,分别包含166043、20732和20797个样本,总大小为13054666168.709字节。建议用于学术用途。
该数据集是LLaVAv1.5的训练数据集之一,包含图像、图像ID、图像URL、问题、答案、标题、作者姓名和类型等特征。数据集分为训练集、验证集和测试集,分别包含166043、20732和20797个样本,总大小为13054666168.709字节。建议用于学术用途。
提供机构:
dddraxxx
原始信息汇总
数据集概述
数据集信息
-
特征:
image: 图像数据image_id: 图像ID,字符串类型imageURL: 图像URL,字符串类型questions: 问题序列,字符串类型answers: 答案序列,字符串类型title: 标题,字符串类型authorName: 作者名称,字符串类型genre: 类别,字符串类型
-
数据集划分:
train: 训练集,包含166043个样本,大小为10850760200.286541字节val: 验证集,包含20732个样本,大小为1097581965.6891787字节test: 测试集,包含20797个样本,大小为1106324002.7332811字节
-
数据集大小:
- 下载大小: 9143129760字节
- 数据集总大小: 13054666168.709字节
配置信息
- 配置名称: default
- 数据文件路径:
- 训练集:
data/train-* - 验证集:
data/val-* - 测试集:
data/test-*
- 训练集:
- 数据文件路径:
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



