dipta007/bengali-visual-genome-1.0-prompt
收藏Hugging Face2024-07-13 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/dipta007/bengali-visual-genome-1.0-prompt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像识别和多语言文本处理的相关数据。具体特征包括图像ID、图像中的坐标(X, Y, W, H)、英文和孟加拉文文本、完整图像和部分图像。数据集被划分为训练集、开发集、测试集和挑战集,每个部分都有详细的样本数量和数据大小。
This dataset includes data related to image recognition and multilingual text processing. Features include image ID, coordinates (X, Y, W, H) in images, English and Bengali text, full images, and partial images. The dataset is divided into train, dev, test, and challenge sets, each with specified number of examples and data size.
提供机构:
dipta007
原始信息汇总
数据集概述
数据集特征
- image_id: 整数类型
- X: 整数类型
- Y: 整数类型
- W: 整数类型
- H: 整数类型
- Eng: 字符串类型
- Ben: 字符串类型
- img_context: 图像类型
- img_partial: 图像类型
数据集分割
- train:
- 样本数: 28930
- 大小: 4463449812.54 字节
- dev:
- 样本数: 998
- 大小: 215098098.0 字节
- test:
- 样本数: 1595
- 大小: 354520722.64 字节
- challenge:
- 样本数: 1400
- 大小: 276253135.2 字节
数据集大小
- 下载大小: 7162358036 字节
- 数据集大小: 5309321768.38 字节
配置
- config_name: default
- 数据文件路径:
- train: data/train-*
- dev: data/dev-*
- test: data/test-*
- challenge: data/challenge-*
- 数据文件路径:



