prashanthpillai/docvqa_1000_examples
收藏Hugging Face2023-04-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/prashanthpillai/docvqa_1000_examples
下载链接
链接失效反馈官方服务:
资源简介:
数据集名为docvqa_1000_examples,包含1000个训练样本和200个测试样本。数据集的特征包括id、image、query(包含多种语言的查询)、answers、words、bounding_boxes和answer(包含匹配分数、匹配文本、起始位置和文本)。数据集的总大小为452199576字节,下载大小为148367971字节。
数据集名为docvqa_1000_examples,包含1000个训练样本和200个测试样本。数据集的特征包括id、image、query(包含多种语言的查询)、answers、words、bounding_boxes和answer(包含匹配分数、匹配文本、起始位置和文本)。数据集的总大小为452199576字节,下载大小为148367971字节。
提供机构:
prashanthpillai
原始信息汇总
数据集概述
数据集信息
- 特征列表:
id:类型为字符串。image:类型为图像。query:包含多个语言字段,每个字段类型为字符串,包括:de:德语en:英语es:西班牙语fr:法语it:意大利语
answers:字符串序列。words:字符串序列。bounding_boxes:浮点数序列,每个序列长度为4。answer:包含多个字段,包括:match_score:类型为浮点数。matched_text:类型为字符串。start:类型为整数。text:类型为字符串。
数据集分割
- 训练集:
- 字节数:381430038.0
- 样本数:1000
- 测试集:
- 字节数:70769538.0
- 样本数:200
数据集大小
- 下载大小:148367971
- 数据集大小:452199576.0



