five

TrainingDataPro/ocr-generated-machine-readable-zone-mrz-text-detection

收藏
Hugging Face2024-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TrainingDataPro/ocr-generated-machine-readable-zone-mrz-text-detection
下载链接
链接失效反馈
官方服务:
资源简介:
OCR GENERATED Machine-Readable Zone (MRZ) Text Detection数据集包含生成的包含机器可读区域(MRZ)的照片,这些区域通常出现在护照、签证和身份证等身份证明文件上。每张照片都附有文本检测和光学字符识别(OCR)结果。数据集的结构包括图像文件夹、边界框标注文件夹和包含边界框坐标和检测到的文本的XML注释文件。数据集适用于开发与文档验证、身份认证或从身份证明文件中自动提取数据相关的应用程序。
提供机构:
TrainingDataPro
原始信息汇总

OCR GENERATED Machine-Readable Zone (MRZ) Text Detection

数据集描述

该数据集包含一系列生成的照片,这些照片包含通常在护照、签证和身份证等身份识别文件上找到的机器可读区域(MRZ)。每个照片都附带文本检测和**光学字符识别(OCR)**结果。

应用场景

该数据集适用于开发与文件验证、身份认证或从身份识别文件中自动提取数据相关的应用程序。

数据集结构

  • images:包含原始文档图像。
  • boxes:包含原始图像的边界框标注。
  • annotations.xml:包含原始照片的边界框坐标和检测到的文本。

数据格式

images文件夹中的每张图像都伴随一个annotations.xml文件,该文件指示边界框的坐标和检测到的文本。每个点的x和y坐标都提供。

注意事项

该数据集仅用于信息或教育目的,不应用于任何欺诈或欺骗活动。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作