howard-hou/COCO-Text
收藏Hugging Face2023-05-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/howard-hou/COCO-Text
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: coco_file_name
dtype: string
- name: image_id
dtype: string
- name: caption
sequence: string
- name: ocr_tokens
sequence: string
- name: ocr_info
list:
- name: word
dtype: string
- name: bounding_box
struct:
- name: width
dtype: float64
- name: height
dtype: float64
- name: top_left_x
dtype: float64
- name: top_left_y
dtype: float64
- name: image_width
dtype: int64
- name: image_height
dtype: int64
splits:
- name: train
num_bytes: 2230879987.67
num_examples: 13097
- name: validation
num_bytes: 526583286.88
num_examples: 3074
download_size: 259904361
dataset_size: 2757463274.55
---
# Dataset Card for "COCO-Text"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
howard-hou
原始信息汇总
数据集概述
数据集名称
COCO-Text
数据集特征
- image: 图像数据
- coco_file_name: 字符串类型,文件名
- image_id: 字符串类型,图像ID
- caption: 字符串序列,图像描述
- ocr_tokens: 字符串序列,OCR识别的文本片段
- ocr_info: 列表类型,包含以下结构:
- word: 字符串类型,识别的单词
- bounding_box: 结构体,包含以下属性:
- width: 浮点数类型,宽度
- height: 浮点数类型,高度
- top_left_x: 浮点数类型,左上角x坐标
- top_left_y: 浮点数类型,左上角y坐标
- image_width: 整数类型,图像宽度
- image_height: 整数类型,图像高度
数据集分割
- train: 训练集,包含13097个样本,占用2230879987.67字节
- validation: 验证集,包含3074个样本,占用526583286.88字节
数据集大小
- 下载大小: 259904361字节
- 数据集总大小: 2757463274.55字节



