Vietnamese License Plate Dataset YOLO

github2026-05-08 更新2026-05-09 收录

下载链接：

https://github.com/franceto/Dataset-Vietnamese-License-Plate

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于目标检测的越南车牌数据集，包含从Google Images收集的图像，手动标注，并预处理为YOLO格式。数据集包含多种车辆类型和背景条件下的车牌图像，适用于车牌检测任务。

This is a Vietnamese license plate dataset for object detection. The images are collected from Google Images, manually annotated, and preprocessed into the YOLO format. The dataset contains license plate images under various vehicle types and background conditions, and is suitable for license plate detection tasks.

创建时间：

2026-05-02

原始信息汇总

好的，根据您提供的README文件内容，以下是该数据集的详情总结。

数据集概述：越南车牌数据集 (YOLO格式)

该数据集专门用于越南车牌检测任务，旨在从真实场景的图像中定位和识别车牌。

核心信息

任务类型：目标检测（License Plate Detection）
国家：越南
类别数：1个
类别名称：Bien-so
标注格式：YOLO Bounding Box，坐标已归一化至 [0, 1] 区间。
数据来源：图像来自 Google Images。
标注工具：使用 Roboflow 进行手动标注。
数据划分：训练集（Train）/ 验证集（Val）/ 测试集（Test）按 70/20/10 比例划分。
数据增强：仅对训练集进行数据增强，验证集和测试集保持原始状态以避免数据泄露。

数据集规模与统计

原始图像总数：728张
原始边界框总数：964个
数据划分详情：

数据子集	图像数量	标签文件数
Train	509	509
Val	146	146
Test	73	73

数据特点与场景

数据集覆盖了多种复杂场景，包括：

车辆类型：摩托车、轿车、卡车等。
拍摄条件：明亮、昏暗、模糊、反光、部分遮挡、复杂背景。
车牌状态：车牌较小、倾斜、距离摄像头较远、单张图像中包含多个车牌。

数据预处理与增强

预处理流程：去重→Roboflow标注→转换为YOLO格式→校验标签→安全划分数据集。
训练集增强策略（仅应用于训练集）：
- 亮度/对比度：模拟光照变化。
- 色调/饱和度：模拟色彩差异。
- 轻微模糊：模拟图像模糊。
- 缩放/平移：模拟位置变化。
- 小角度旋转：模拟拍摄角度偏差。
避免的增强：避免使用可能导致车牌特征失真的变换（如水平/垂直翻转、90°/180°旋转、强裁剪、直接遮挡车牌区域的Cutout）。

相关资源

数据集下载：Kaggle - Vietnamese License Plates Dataset
YOLOv26训练仓库：Yolov26 License Plate Number Detection
数据预处理Notebook：位于仓库 notebooks/bs.ipynb
作者GitHub：franceto (ANH PHAP TO)

搜集汇总

数据集介绍

构建方式

该数据集聚焦于越南车牌检测任务，图像全部源自Google Images，经过人工去重后，借助Roboflow平台进行手工标注，生成精确贴合车牌区域的边界框。随后，通过Python脚本将标注格式统一转换为YOLO Bounding Box格式，并按照70%、20%、10%的比例划分为训练集、验证集与测试集。为确保评估的公正性，仅对训练集实施数据增强操作，验证集与测试集则保持原始状态，有效避免了数据泄露风险。

使用方法

数据集以YOLO格式存储，标签文件为与图像同名的.txt文件，每行记录类别ID及归一化后的边界框中心坐标与宽高。配套的data.yaml文件定义了训练、验证、测试集路径及类别信息。用户可通过Git克隆仓库或Kaggle命令行下载数据，安装requirements.txt依赖后，直接使用YOLO系列模型进行训练，如执行`yolo detect train model=yolov8n.pt data=dataset/data.yaml imgsz=640 epochs=100`。此外，项目提供了完整的Jupyter Notebook，可复现从数据解压、清洗到增强导出的全流程。

背景与挑战

背景概述

随着智能交通与自动驾驶技术的蓬勃发展，车牌检测作为车辆身份识别的核心环节，在交通管理、安防监控等领域扮演着不可或缺的角色。然而，越南独特的车牌样式、复杂的交通环境以及多样的拍摄条件，为车牌检测算法带来了严峻考验。为此，研究者Franceto于近期构建了Vietnamese License Plate Dataset YOLO数据集，该数据集由Google Images采集的728张真实场景图像构成，经Roboflow手工标注后，统一转换为YOLO边界框格式，并按照70/20/10的比例划分为训练、验证与测试集。该数据集专注于单一类别“Bien-so”的检测任务，不仅为越南车牌检测研究提供了标准化的基准数据，也通过开源共享推动了计算机视觉技术在东南亚地区的应用与拓展。

当前挑战

该数据集所解决的领域问题聚焦于复杂场景下的车牌检测，其挑战在于越南交通环境中车辆类型多样（摩托车、轿车、卡车），拍摄条件复杂（光照变化、模糊、眩光、部分遮挡），且车牌在图像中可能呈现小目标、倾斜角度大或远距离等状态，同时单张图像中可能包含多个车牌，这要求检测算法具备出色的鲁棒性与泛化能力。在数据集构建过程中，挑战同样显著：初始数据通过Google Images爬取，需人工剔除重复图像以确保数据纯净；手工标注使用Roboflow工具，但面对不规则多边形车牌区域，需将标注结果标准化为YOLO格式的边界框，并严格校验空标签、错误类别及异常边界框；此外，数据增强阶段需精心选择变换策略，避免翻转、强裁剪或直接遮挡等可能破坏车牌特征的增强操作，同时确保训练集增强后验证集与测试集保持原始分布，杜绝数据泄露风险。

常用场景

经典使用场景

在智能交通与计算机视觉的交汇领域，车牌检测作为一项基础而关键的任务，其性能高度依赖于高质量标注数据集的支撑。该越南车牌数据集专为YOLO系列目标检测模型设计，经典使用场景聚焦于在复杂光照、多角度拍摄及背景混杂的真实街景图像中，精准定位各类车辆（包括摩托车、轿车及卡车）的车牌区域。数据集涵盖728张原始图像，经过严格筛选与手工标注，生成964个紧密贴合车牌边界的边界框，并采用70/20/10的比例划分为训练、验证与测试集，为训练鲁棒的车牌检测器提供了标准化基准。

解决学术问题

该数据集系统性地回应了目标检测领域在特定地域与复杂环境下面临的若干核心学术挑战，包括小目标检测、多尺度适应以及遮挡与光照干扰下的鲁棒性提升。通过提供包含摩托车、货车等多样化车型以及弱光、强光、模糊、部分遮挡等退化场景的图像，它有效弥补了通用数据集在越南本土车牌特征上的空白。数据集的构建为对比不同YOLO架构（如YOLOv8n至YOLOv26）在车牌检测任务上的表现提供了统一平台，其公开的基准测试结果——验证集mAP50达到0.967，测试集mAP50为0.949——为度量检测算法的泛化能力与实用性确立了重要参考，推动了针对特定区域车牌检测技术的可重复性研究。

实际应用

在实际应用层面，该数据集的落地价值体现在多个智能交通与安防系统中。首先，它可直接赋能交通执法监控系统，实现自动化车牌识别与违规行为取证，例如闯红灯抓拍、超速检测及停车场出入管理。其次，在智慧城市框架下，该数据集支持车辆轨迹追踪与交通流量分析，通过实时检测车牌辅助完成车辆身份确认与路径回溯。此外，基于该数据集训练的模型已成功部署于YOLOv26检测框架，展现出高精度（精度0.988）与高召回率（0.901），验证了其在现实场景中处理多车牌、小尺寸及倾斜车牌等挑战的有效性，为商业级车牌识别产品提供了可靠的数据基石。

数据集最近研究