Vietnamese License Plate Dataset

github2026-05-07 更新2026-05-08 收录

下载链接：

https://github.com/franceto/Vietnamese-License-Plate-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

越南车牌数据集，用于目标检测任务，包含从Google Images收集的越南车牌图像，手动标注，预处理并转换为YOLO格式。数据集包含多种车辆类型和背景条件下的车牌图像，适用于训练和评估目标检测模型。

Vietnamese License Plate Dataset is designed for object detection tasks. It contains Vietnamese license plate images collected from Google Images, with manual annotations, preprocessed and converted to YOLO format. The dataset includes license plate images under various vehicle types and background conditions, and is suitable for training and evaluating object detection models.

创建时间：

2026-05-02

原始信息汇总

好的，这是根据您提供的越南车牌数据集详情页面README内容总结的关键信息：

数据集概述

该数据集是一个用于目标检测（Object Detection）任务的越南车牌图像数据集。数据集的图像收集自Google Images，并经过人工标注、预处理和增强，最终以YOLO Bounding Box (bbox) 格式发布。

核心信息

项目	描述
任务	车牌检测 (License Plate Detection)
国家	越南 (Việt Nam)
类别	`Bien-so` (仅1个类别)
数据格式	YOLO bbox (`.txt` 文件，标准化坐标)
标注方式	使用 Roboflow 进行人工标注
数据划分	训练集 (Train) / 验证集 (Val) / 测试集 (Test)
数据增强	仅应用于训练集

数据集统计

原始图像数量: 728张
原始边界框总数: 964个
原始数据划分:
- 训练集: 509张图片, 509个标签
- 验证集: 146张图片, 146个标签
- 测试集: 73张图片, 73个标签
当前版本: 训练集已应用数据增强，验证集和测试集保持原始状态。

数据特性

包含多种车辆类型（摩托车、轿车、卡车）和场景（明亮、昏暗、模糊、眩光、部分遮挡、复杂背景）。
车牌在图像中可能较小、倾斜、远离相机，或单张图像中包含多个车牌。
边界框紧密贴合车牌区域，不包含车辆或背景。

数据预处理与增强

预处理步骤: 包括图像去重、尺寸检查、标签格式转换（OBB/Polygon 到 YOLO bbox）、标签有效性验证、以及数据的安全划分。
训练集增强方法: 包括亮度/对比度调整、色调/饱和度调整、轻微模糊、缩放/平移、以及小角度旋转。避免使用水平/垂直翻转、90°/180°旋转、强裁剪等可能破坏车牌特征的增强方法。

数据集文件结构

. ├── assets/ # 静态资源 (示例图片、统计图、检测结果图) ├── dataset/ # 核心数据集 │ ├── data.yaml # YOLO 配置文件 │ ├── train/ │ │ ├── images/ # 训练集图片 │ │ └── labels/ # 训练集标签 │ ├── val/ │ │ ├── images/ # 验证集图片 │ │ └── labels/ # 验证集标签 │ └── test/ │ ├── images/ # 测试集图片 │ └── labels/ # 测试集标签 ├── notebooks/ # 预处理和复现流程的 Jupyter Notebook │ └── bs.ipynb ├── .gitignore ├── README.md └── requirements.txt

模型基准测试

该数据集已使用YOLOv26模型进行测试，基准测试结果如下：

指标	验证集	测试集
Precision	0.9673	0.9883
Recall	0.9281	0.9006
mAP50	0.9672	0.9494
mAP50-95	0.6896	0.6927

全局平均 mAP50 为 0.967，mAP50-95 为 0.693。

快速开始

克隆仓库：git clone https://github.com/franceto/Dataset_License-plate-number.git
安装依赖：pip install -r requirements.txt
使用YOLO训练：yolo detect train model=yolov8n.pt data=dataset/data.yaml imgsz=640 epochs=100 batch=16
(可选)从Kaggle下载数据集：kaggle datasets download -d tanhphp/vietnamese-license-plates -p ./kaggle_dataset --unzip

补充信息

作者: franceto (ANH PHAP TO)
用途: 仅供学习、研究和实践计算机视觉使用。
数据源: 可通过提供的 Kaggle 链接或 GitHub 仓库获取。

搜集汇总

数据集介绍

构建方式

在智慧交通与安防监控领域，车牌检测作为计算机视觉的重要应用，对数据集的真实性与多样性要求极高。本数据集聚焦越南实际道路场景中的车牌检测任务，图像全部采集自Google Images，涵盖了摩托车、轿车、卡车等多种车型以及不同光照、模糊、遮挡和复杂背景等现实条件。数据集的构建经历了严谨的流水线：首先对原始图像进行去重和尺寸标准化预处理，随后借助Roboflow平台开展手工标注，精确勾勒车牌区域的边界框。标注结果被统一转换为YOLO标准的五列坐标格式，并通过Python脚本完成标签校验、数据集以70/20/10比例划分训练、验证与测试集。仅在训练集上应用了亮度对比度调整、色相饱和度微调、轻微模糊及缩放平移旋转等数据增强策略，确保模型泛化能力的同时，保留验证与测试集的原始分布用以客观评估。最终形成包含单一类别“Bien-so”、总计964个标注框、728张原始图像的高质量物体检测数据集。

特点

该数据集最鲜明的特质在于其高度的真实性与场景覆盖度。全部图像源于现实街景而非仿真渲染，囊括了晨昏光线剧烈的明暗变化、雨天或镜头灰尘造成的模糊噪点、夕阳或车灯引发的强烈眩光、部分牌面被行人或他车遮挡、以及牌照倾斜或远距离拍摄等挑战案例。每张图像中的多个车牌均被独立且紧贴边界地标注，避免包裹车体或背景带来的冗余信息，这极大地提升了训练信号的纯度。数据集在统计层面呈现出鲜明的视觉多样性：图像尺寸分布宽广，边界框规模跨度大，从近景清晰的全幅牌照到远景中仅有几个像素的微小目标均有覆盖。此外，训练增强环节精心规避了对车牌文本特征产生破坏的翻转或大幅裁剪操作，这种考量确保了增强后的样本依然忠实于原始语义。完整的YOLO格式标签、一次下载即可投入使用的数据集结构，以及配套的预处理复现笔记，共同构筑了其作为越南车牌检测基准数据集的实用价值。

使用方法

使用者克隆仓库后，通过安装requirements.txt依赖即可快速搭建环境。数据集的目录结构清晰，data.yaml配置文件已预先定义好训练、验证、测试集的图像路径以及类别名称与数量。以YOLOv8n为例，一条简单的命令行指令即可启动训练，参数可灵活调整如imgsz图像尺寸、epochs迭代轮次与batch批量大小。训练完成后，使用验证命令即可获得精确率、召回率与mAP等关键指标。针对新图像的推理预测同样便捷，指定模型权重与图像路径即可输出检测结果。若希望从头复现数据预处理流程，bs.ipynb笔记本文档详细记录了从原始图像解压到最终数据集导出的全部十一个步骤，便于研究者进行二次加工或移植至其他检测框架。数据集的Kaggle下载链接亦提供备用渠道，满足不同网络环境下的获取需求。这种从数据处理到模型部署的全链路支持，使得该数据集特别适合作为越南车牌检测任务的教学范例与算法开发起点。

背景与挑战

背景概述

车牌检测作为智能交通系统的基石技术，在车辆身份识别、违章监控及城市安防等领域具有关键应用价值。然而，不同国家与地区的车牌在字体、颜色、尺寸及布局上存在显著差异，使得通用检测模型难以直接适配，亟需区域定制化的高质量数据集来驱动模型训练。在此背景下，由研究者Anh Phap To于近期创建的Vietnamese License Plate Dataset应运而生，该数据集专门针对越南车牌进行采集与标注，旨在解决真实场景下越南车牌的检测难题。数据集通过Google Images获取原始图像，采用Roboflow进行人工精细标注，并遵循YOLO Bounding Box格式进行标准化处理，最终形成了包含单一‘Bien-so’类别、总计数百张图像及近千个标注框的专用资源。该数据集的出现为越南本地智能交通系统的研发提供了宝贵的基础数据资产，推动了面向特定区域车牌检测技术的实证进展。

当前挑战

该数据集所致力解决的领域问题主要围绕车牌检测任务在复杂环境下的鲁棒性与泛化能力。越南实际道路场景中，车辆（含摩托车、轿车、货车）与背景（如光照变化、夜间低照度、强光直射、运动模糊、部分遮挡及复杂街景）的多变性导致车牌区域极易被干扰，传统检测模型在面对此类非受控条件时往往性能骤降。此外，车牌在图像中可能呈现小目标、倾斜旋转或远距离分布，且同一图像内常存在多个待检车牌，进一步加剧了检测难度。在数据集构建过程中，挑战同样显著：原始图像来源多样，需经历严格去重以避免数据冗余；人工标注须确保边界框紧密贴合车牌边缘，避免引入过多背景噪声；数据集规模有限，需借助数据增强技术（如亮度调整、模糊模拟、尺度变化及轻微旋转）在扩充训练样本多样性的同时，谨防过度变形导致车牌核心特征失真。最终还需严格分割训练/验证/测试集，确保评估的公平性与无泄露。

常用场景

经典使用场景

在智能交通与计算机视觉的交叉领域，该数据集主要用于越南场景下车辆牌照的目标检测任务。其核心应用场景包括对复杂背景中摩托车、轿车及卡车等多种车辆类型所悬挂的牌照进行精准定位。数据集中包含了光照变化、部分遮挡、倾斜角度以及多牌照共存等真实挑战性案例，为训练鲁棒的检测模型提供了丰富素材。研究人员常将其与YOLO系列算法结合，作为评估越南牌照检测性能的标准基准，推动了该区域特定场景下物体检测技术的进步。

实际应用

在实际产业落地方面，该数据集直接赋能了越南智慧交通管理系统中的车辆身份识别环节。基于该数据训练的模型可部署于电子警察、停车场自动收费及城市安防监控等系统，实现对通行车辆的实时牌照定位与后续字符识别。数据集对昏暗、逆光、污损等极端场景的覆盖，提升了系统在恶劣条件下的稳定性。此外，其标准化的YOLO格式降低了算法集成门槛，加速了从学术原型到商业应用的转化，有效支撑了越南本土智能交通基础设施的数字化升级。

衍生相关工作

围绕该数据集衍生了一系列经典工作，其中最典型的是基于YOLOv26的越南牌照检测专项研究，验证了其在验证集上达到96.72%的mAP50与94.94%的测试集精度。此外，数据集的发布催生了多模态识别管线构建，即结合检测与OCR技术的端到端自动车牌识别系统。部分研究者将此数据集作为数据扩充的种子，通过风格迁移或对抗生成扩展场景多样性。其清晰的预处理和标注流程也为其他小语种国家构建类似数据集提供了方法论参考，推动了区域化计算机视觉资源建设范式的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集