five

howard-hou/COCO-Text

收藏
Hugging Face2023-05-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/howard-hou/COCO-Text
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: coco_file_name dtype: string - name: image_id dtype: string - name: caption sequence: string - name: ocr_tokens sequence: string - name: ocr_info list: - name: word dtype: string - name: bounding_box struct: - name: width dtype: float64 - name: height dtype: float64 - name: top_left_x dtype: float64 - name: top_left_y dtype: float64 - name: image_width dtype: int64 - name: image_height dtype: int64 splits: - name: train num_bytes: 2230879987.67 num_examples: 13097 - name: validation num_bytes: 526583286.88 num_examples: 3074 download_size: 259904361 dataset_size: 2757463274.55 --- # Dataset Card for "COCO-Text" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
howard-hou
原始信息汇总

数据集概述

数据集名称

COCO-Text

数据集特征

  • image: 图像数据
  • coco_file_name: 字符串类型,文件名
  • image_id: 字符串类型,图像ID
  • caption: 字符串序列,图像描述
  • ocr_tokens: 字符串序列,OCR识别的文本片段
  • ocr_info: 列表类型,包含以下结构:
    • word: 字符串类型,识别的单词
    • bounding_box: 结构体,包含以下属性:
      • width: 浮点数类型,宽度
      • height: 浮点数类型,高度
      • top_left_x: 浮点数类型,左上角x坐标
      • top_left_y: 浮点数类型,左上角y坐标
  • image_width: 整数类型,图像宽度
  • image_height: 整数类型,图像高度

数据集分割

  • train: 训练集,包含13097个样本,占用2230879987.67字节
  • validation: 验证集,包含3074个样本,占用526583286.88字节

数据集大小

  • 下载大小: 259904361字节
  • 数据集总大小: 2757463274.55字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作