Multimodal-Fatima/TextVQA_train

Name: Multimodal-Fatima/TextVQA_train
Creator: Multimodal-Fatima
Published: 2023-05-13 17:34:14
License: 暂无描述

Hugging Face2023-05-13 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Multimodal-Fatima/TextVQA_train

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: image_id dtype: string - name: question_id dtype: int32 - name: question dtype: string - name: question_tokens sequence: string - name: image dtype: image - name: image_width dtype: int32 - name: image_height dtype: int32 - name: flickr_original_url dtype: string - name: flickr_300k_url dtype: string - name: answers sequence: string - name: image_classes sequence: string - name: set_name dtype: string - name: id dtype: int64 - name: id_image dtype: int64 splits: - name: train num_bytes: 9836053547.652 num_examples: 34602 download_size: 6184373820 dataset_size: 9836053547.652 --- # Dataset Card for "TextVQA_train" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

Multimodal-Fatima

原始信息汇总

数据集概述

数据集名称

TextVQA_train

数据集特征

image_id: 数据类型为字符串。
question_id: 数据类型为整数32位。
question: 数据类型为字符串。
question_tokens: 数据类型为字符串序列。
image: 数据类型为图像。
image_width: 数据类型为整数32位。
image_height: 数据类型为整数32位。
flickr_original_url: 数据类型为字符串。
flickr_300k_url: 数据类型为字符串。
answers: 数据类型为字符串序列。
image_classes: 数据类型为字符串序列。
set_name: 数据类型为字符串。
id: 数据类型为整数64位。
id_image: 数据类型为整数64位。

数据集分割

train:
- 示例数量: 34602
- 数据大小: 9836053547.652字节

数据集大小

下载大小: 6184373820字节
数据集总大小: 9836053547.652字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集