ReplugLens/TextVQA
收藏Hugging Face2024-06-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ReplugLens/TextVQA
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question_id
dtype: int32
- name: question
dtype: string
- name: image
dtype: image
- name: answers
sequence: string
- name: id_image
dtype: int64
splits:
- name: test
num_bytes: 1677847253.0
num_examples: 5734
- name: train
num_bytes: 9746872801.0
num_examples: 34602
download_size: 7170106245
dataset_size: 11424720054.0
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
- split: train
path: data/train-*
---
数据集信息:
特征:
- 名称:question_id(问题ID),数据类型:32位整型(int32)
- 名称:question(问题文本),数据类型:字符串
- 名称:image(图像),数据类型:图像(image)
- 名称:answers(答案序列),数据类型:字符串序列
- 名称:id_image(图像ID),数据类型:64位整型(int64)
数据集划分:
- 划分名称:测试集(test),占用字节数:1677847253.0,样本数量:5734
- 划分名称:训练集(train),占用字节数:9746872801.0,样本数量:34602
下载大小:7170106245 字节,数据集总大小:11424720054 字节
配置项:
- 配置名称:默认配置(default),数据文件:
- 划分:测试集(test),路径:data/test-*
- 划分:训练集(train),路径:data/train-*
提供机构:
ReplugLens
原始信息汇总
数据集概述
数据集特征
- question_id: 数据类型为 int32。
- question: 数据类型为 string。
- image: 数据类型为 image。
- answers: 数据类型为 sequence of string。
- id_image: 数据类型为 int64。
数据集分割
- test:
- 示例数量: 5734
- 数据大小: 1677847253.0 字节
- train:
- 示例数量: 34602
- 数据大小: 9746872801.0 字节
数据集大小
- 下载大小: 7170106245 字节
- 总数据集大小: 11424720054.0 字节
配置文件
- default:
- test: 数据文件路径为
data/test-* - train: 数据文件路径为
data/train-*
- test: 数据文件路径为



