five

tejasexpress/ocr-annotation

收藏
Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tejasexpress/ocr-annotation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含图像及其相关的OCR标注文本、图像高度和图像宽度信息。数据集配置为默认配置,包含一个训练集分割,数据文件路径为sentence_dataframe.parquet。

该数据集包含图像及其相关的OCR标注文本、图像高度和图像宽度信息。数据集配置为默认配置,包含一个训练集分割,数据文件路径为sentence_dataframe.parquet。
提供机构:
tejasexpress
原始信息汇总

数据集信息

特征

  • image: 图像数据,数据类型为图像。
  • ocr_annotation_texts: OCR注解文本,数据类型为字符串。
  • image_height: 图像高度,数据类型为int64。
  • image_width: 图像宽度,数据类型为int64。

配置

  • config_name: default
    • data_files:
      • split: train
        • path: sentence_dataframe.parquet
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作