lansinuote/ocr_id_card
收藏Hugging Face2024-01-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lansinuote/ocr_id_card
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像和OCR(光学字符识别)数据。图像数据以图像格式存储,OCR数据包含每个字符的边界框(box)、类别(cls)和对应的单词(word)。数据集仅包含一个训练集,共有20,000个样本,总大小为3,979,598,471字节。数据文件位于data/train-*路径下。
该数据集包含图像和OCR(光学字符识别)数据。图像数据以图像格式存储,OCR数据包含每个字符的边界框(box)、类别(cls)和对应的单词(word)。数据集仅包含一个训练集,共有20,000个样本,总大小为3,979,598,471字节。数据文件位于data/train-*路径下。
提供机构:
lansinuote
原始信息汇总
数据集概述
数据特征
- 图像
- 名称: image
- 数据类型: image
- OCR信息
- 名称: ocr
- 包含以下子特征:
- 框
- 名称: box
- 序列类型: float64
- 分类
- 名称: cls
- 数据类型: int64
- 单词
- 名称: word
- 数据类型: string
- 框
数据分割
- 训练集
- 名称: train
- 字节数: 3979598471.0
- 样本数: 20000
数据集大小
- 下载大小: 3978058364
- 数据集大小: 3979598471.0
配置
- 默认配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



