dipta007/bengali-visual-genome-1.0-prompt

Name: dipta007/bengali-visual-genome-1.0-prompt
Creator: dipta007
Published: 2024-07-13 05:44:11
License: 暂无描述

Hugging Face2024-07-13 更新2024-07-13 收录

下载链接：

https://hf-mirror.com/datasets/dipta007/bengali-visual-genome-1.0-prompt

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含图像识别和多语言文本处理的相关数据。具体特征包括图像ID、图像中的坐标（X, Y, W, H）、英文和孟加拉文文本、完整图像和部分图像。数据集被划分为训练集、开发集、测试集和挑战集，每个部分都有详细的样本数量和数据大小。

This dataset includes data related to image recognition and multilingual text processing. Features include image ID, coordinates (X, Y, W, H) in images, English and Bengali text, full images, and partial images. The dataset is divided into train, dev, test, and challenge sets, each with specified number of examples and data size.

提供机构：

dipta007

原始信息汇总

数据集概述

数据集特征

image_id: 整数类型
X: 整数类型
Y: 整数类型
W: 整数类型
H: 整数类型
Eng: 字符串类型
Ben: 字符串类型
img_context: 图像类型
img_partial: 图像类型

数据集分割

train:
- 样本数: 28930
- 大小: 4463449812.54 字节
dev:
- 样本数: 998
- 大小: 215098098.0 字节
test:
- 样本数: 1595
- 大小: 354520722.64 字节
challenge:
- 样本数: 1400
- 大小: 276253135.2 字节

数据集大小

下载大小: 7162358036 字节
数据集大小: 5309321768.38 字节

配置

config_name: default
- 数据文件路径:
  - train: data/train-*
  - dev: data/dev-*
  - test: data/test-*
  - challenge: data/challenge-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集