TrainingDataPro/ocr-generated-machine-readable-zone-mrz-text-detection
收藏Hugging Face2024-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TrainingDataPro/ocr-generated-machine-readable-zone-mrz-text-detection
下载链接
链接失效反馈官方服务:
资源简介:
OCR GENERATED Machine-Readable Zone (MRZ) Text Detection数据集包含生成的包含机器可读区域(MRZ)的照片,这些区域通常出现在护照、签证和身份证等身份证明文件上。每张照片都附有文本检测和光学字符识别(OCR)结果。数据集的结构包括图像文件夹、边界框标注文件夹和包含边界框坐标和检测到的文本的XML注释文件。数据集适用于开发与文档验证、身份认证或从身份证明文件中自动提取数据相关的应用程序。
提供机构:
TrainingDataPro
原始信息汇总
OCR GENERATED Machine-Readable Zone (MRZ) Text Detection
数据集描述
该数据集包含一系列生成的照片,这些照片包含通常在护照、签证和身份证等身份识别文件上找到的机器可读区域(MRZ)。每个照片都附带文本检测和**光学字符识别(OCR)**结果。
应用场景
该数据集适用于开发与文件验证、身份认证或从身份识别文件中自动提取数据相关的应用程序。
数据集结构
- images:包含原始文档图像。
- boxes:包含原始图像的边界框标注。
- annotations.xml:包含原始照片的边界框坐标和检测到的文本。
数据格式
images文件夹中的每张图像都伴随一个annotations.xml文件,该文件指示边界框的坐标和检测到的文本。每个点的x和y坐标都提供。
注意事项
该数据集仅用于信息或教育目的,不应用于任何欺诈或欺骗活动。



