sonnetechnology/license-plate-text-recognition-full
收藏Hugging Face2023-08-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sonnetechnology/license-plate-text-recognition-full
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从`keremberke/license-plate-object-detection`数据集生成的。我们通过获取每个图像中车牌的边界框,裁剪图像以仅显示车牌,并使用`microsoft/trocr-large-printed`模型提取文本信息。数据集的结构与原始数据集相同,但增加了`target`列以存储每个识别出的车牌的文本信息。数据集包含训练集、验证集和测试集,每个分割都提供了字节大小和示例数量。
该数据集是从`keremberke/license-plate-object-detection`数据集生成的。我们通过获取每个图像中车牌的边界框,裁剪图像以仅显示车牌,并使用`microsoft/trocr-large-printed`模型提取文本信息。数据集的结构与原始数据集相同,但增加了`target`列以存储每个识别出的车牌的文本信息。数据集包含训练集、验证集和测试集,每个分割都提供了字节大小和示例数量。
提供机构:
sonnetechnology
原始信息汇总
数据集概述
数据集配置
- 默认配置:
- 训练集:路径为
data/train-* - 验证集:路径为
data/validation-* - 测试集:路径为
data/test-*
- 训练集:路径为
数据集信息
-
特征:
image:图像数据,数据类型为imageimage_id:图像ID,数据类型为int64width:图像宽度,数据类型为int64height:图像高度,数据类型为int64bbox:边界框,数据类型为float64的序列target:目标文本,数据类型为string的序列
-
数据集划分:
- 训练集:
- 字节数:158666312.832
- 样本数:6176
- 验证集:
- 字节数:48023349.6
- 样本数:1765
- 测试集:
- 字节数:22606532
- 样本数:882
- 训练集:
-
数据集大小:
- 下载大小:236835357 字节
- 数据集大小:229296194.43199998 字节
许可证
- 许可证:cc-by-4.0
任务类别
- 任务类别:image-to-text
数据集规模
- 规模:1K<n<10K
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于车牌文本识别的图像到文本数据集,由Sonne Technology, Inc.基于'keremberke/license-plate-object-detection'数据集生成,通过提取车牌边界框、裁剪图像,并使用OCR模型识别文本,添加了目标文本列。数据集包含8,823行数据,分为训练、验证和测试集,格式为parquet,适用于车牌文本识别任务。
以上内容由遇见数据集搜集并总结生成



