VN Vietnamese License Plate Dataset YOLO

github2026-05-02 更新2026-05-04 收录

下载链接：

https://github.com/franceto/Dataset_License-plate-number

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集专注于在真实图像中检测越南车牌的问题。每张图像可能包含一个或多个车牌。边界框标注紧密贴合车牌区域，以支持训练如YOLOv8、YOLOv9、YOLOv11或其他兼容版本的YOLO模型。数据集适用于训练越南车牌检测模型、实践目标检测数据标注、构建基于YOLO的计算机视觉流程以及作为车牌识别问题的测试数据。

This dataset targets the task of Vietnamese license plate detection in real-world images. Each image may contain one or more license plates. The bounding box annotations are tightly aligned with the boundaries of license plate regions, which enables training YOLO-based models including YOLOv8, YOLOv9, YOLOv11 and other compatible versions. This dataset can be used for training Vietnamese license plate detection models, practicing object detection data annotation, constructing YOLO-oriented computer vision workflows, and acting as test data for license plate recognition tasks.

创建时间：

2026-05-02

原始信息汇总

数据集概述：越南车牌号数据集（YOLO格式）

该数据集专为越南车牌检测任务设计，由作者 franceto (ANH PHAP TO) 构建和维护，托管于 GitHub。

📌 核心信息

任务类型：目标检测（Object Detection），具体为检测越南车牌。
数据来源：通过手动方式从 Google Images 收集。
标注工具：使用 Roboflow 平台进行手动标注。
数据格式：YOLO Bounding Box 格式（.txt 标签文件）。
类别：仅有 1 个类别，类别名为 Bien-so。
总样本数：原始图像数量为 728 张，包含 964 个边界框。
数据划分：按 70% / 20% / 10% 的比例分为训练集、验证集和测试集。
- 训练集：509 张图像
- 验证集：146 张图像
- 测试集：73 张图像

🛠️ 技术栈与处理流程

使用技术：Google Images（数据收集）、Roboflow（标注与导出）、Python（预处理）、Albumentations（数据增强）、Jupyter Notebook（实验与流程开发）。
数据预处理流程：图像收集 → 去重 → 手动标注 → 导出为 YOLO 格式 → 转换标签（如有需要） → 数据质量检查 → 划分数据集 → 仅对训练集进行数据增强 → 最终发布。

🎯 数据特点与适用场景

多样性：图像包含多种场景、角度、距离、光照条件（白天/夜晚/背光/眩光）以及复杂背景。部分车牌存在倾斜、模糊或被部分遮挡的情况。
数据增强：仅对训练集应用了轻微增强策略，包括随机亮度/对比度、轻微色调/饱和度、轻微模糊、缩放、平移和小于 ±5 度的旋转。未使用水平/垂直翻转、强旋转或可能破坏车牌特征的剪裁/遮挡操作。
适用场景：
- 训练 YOLOv8、v9、v11 等车牌检测模型。
- 目标检测数据标注实践。
- 基于 YOLO 的计算机视觉流程开发。
- 车牌识别任务的测试数据。

📁 数据集结构与使用

目录结构：

dataset/ ├── data.yaml ├── train/ │ ├── images/ │ └── labels/ ├── val/ │ ├── images/ │ └── labels/ └── test/ ├── images/ └── labels/
标签格式：每行代表一个边界框，格式为 class_id x_center y_center width height（数值已归一化）。示例：0 0.512345 0.634211 0.214532 0.092415。
配置文件：data.yaml 文件内容如下，可直接用于 YOLO 训练。 yaml train: train/images val: val/images test: test/images

nc: 1 names: [Bien-so]
使用示例（来自 README）： bash

训练 YOLOv8n 模型

yolo detect train model=yolov8n.pt data=dataset/data.yaml imgsz=640 epochs=100 batch=16

验证模型

yolo detect val model=runs/detect/train/weights/best.pt data=dataset/data.yaml

预测新图像

yolo detect predict model=runs/detect/train/weights/best.pt source=path/to/image.jpg

⚙️ 运行环境依赖

项目需要以下 Python 库：ultralytics、opencv-python、albumentations、matplotlib、pandas、pillow。

⚠️ 注意事项

该数据集仅供学习、研究和实践计算机视觉使用。若用于商业产品或学术发表，建议自行核查图像版权、隐私及数据来源等问题。

搜集汇总

数据集介绍

构建方式

在车牌识别这一计算机视觉应用领域，高质量标注数据集的构建是模型性能的关键。VN Vietnamese License Plate Dataset YOLO数据集通过精细化的全流程数据处理管线构建而成。首先，研究团队利用谷歌图像搜索，以越南车牌相关词汇为关键词，手工采集了728张原始图像，涵盖多样化的拍摄场景与光照条件。随后，借助Roboflow平台对这些图像进行人工标注，为每一张图像中的单个或多个车牌生成紧密贴合车牌区域的边界框。标注完成后，数据经由Python脚本进行严格的预处理，包括重复图像剔除、标签格式校验以及多边形或旋转框到标准YOLO边界框的转换。最终，数据集按照70%、20%、10%的比例划分为训练集、验证集与测试集，并对训练集仅施加轻度数据增强以提升模型泛化能力，从而形成了可直接用于目标检测模型训练的完整数据集。

使用方法

使用VN Vietnamese License Plate Dataset YOLO数据集训练车牌检测模型极为便捷。数据集遵循标准的YOLO目录结构，包含train、val、test三个子文件夹，每个文件夹下分别存放images与labels，同时附带描述数据集配置的data.yaml文件，其中指定了类别数量（nc: 1）与类别名称（names: ['Bien-so']）。用户只需确保环境安装了所需的依赖库（如ultralytics、opencv-python等），即可直接调用YOLO命令行工具进行训练。例如，通过命令'yolo detect train model=yolov8n.pt data=dataset/data.yaml imgsz=640 epochs=100 batch=16'即可启动训练流程。训练完成后，可利用'yolo detect val'对模型进行验证性能评估，或使用'yolo detect predict'对新图像进行实时车牌检测。此数据集的设计极大降低了使用门槛，研究人员和开发者无需进行繁琐的格式转换或数据预处理，能够快速将其投入到越南车牌的实际检测应用中。

背景与挑战

背景概述

越南车牌检测数据集（VN Vietnamese License Plate Dataset YOLO）由研究者Franceto于近年创建，主要依托Google Image进行图像采集，并借助Roboflow平台完成手工标注，最终以YOLO边界框格式标准化输出。该数据集聚焦于越南车牌在真实场景中的目标检测问题，涵盖多种光照、角度、距离及复杂背景下的摩托车和汽车车牌图像，共计728张原始图片与964个边界框。其发布为基于YOLOv8、YOLOv11等模型的车牌检测系统提供了高质量的训练与评估基准，推动了越南本土车牌识别技术在智能交通、安防监控等领域的应用发展。

当前挑战

该数据集面临的核心挑战首先在于领域问题本身的复杂性：越南车牌在真实环境中常出现倾斜、模糊、部分遮挡、小尺寸及夜间低光照等情形，这要求检测模型具备极强的泛化能力与鲁棒性。其次，在数据构建过程中，研究者需应对图像采集的版权与隐私合规问题，手工标注的精度控制，以及数据增强策略的谨慎设计——既要丰富训练集多样性（如随机亮度、轻微模糊、小角度旋转），又避免破坏车牌字符特征（禁止水平翻转、大幅度裁剪或直接遮挡）。此外，有限样本量（728张）对模型克服过拟合提出了更高要求，数据扩充的边界与有效性也成为重要权衡点。

常用场景

经典使用场景

VN Vietnamese License Plate Dataset YOLO 的核心应用场景聚焦于越南车牌的目标检测任务，为复杂交通环境下的车牌定位提供了标准化的训练与评估基准。该数据集包含728张从Google Image采集的真实场景图像，覆盖了多样化的拍摄角度、光照条件（包括昼夜、暗光与强光）、背景复杂度（如街道、住宅区）以及车牌被部分遮挡、倾斜或模糊等挑战性情况。数据集严格遵循YOLO边界框标注格式，每张图像可能包含单个或多个车牌，标注区域精准贴合车牌边缘而非整车或背景，使得研究者能够直接用于训练YOLOv8、YOLOv9、YOLOv11等主流目标检测模型。通过预设的70/20/10训练-验证-测试划分，数据集不仅支持模型从多样化样本中学习鲁棒的特征表达，还确保了对泛化性能的客观评估，成为越南车牌检测领域中一个轻量级但高度聚焦的实战级资源。

解决学术问题

该数据集着力解决越南车牌自动检测这一细粒度计算机视觉问题中的核心学术挑战，即如何在有限标注样本下实现高精度且鲁棒的定位。现有通用车牌数据集多基于欧美或中国车牌设计，而越南车牌的字符排布、尺寸比例及颜色规范具有独特性，直接迁移预训练模型常出现领域漂移现象。此数据集通过提供纯越南场景的车牌边界框标注，消除了地域性特征差异带来的适配瓶颈。更为关键的是，数据集设计了一套严谨的预处理与增强策略：仅对训练集施加温和的亮度、饱和度、模糊及小幅旋转变换，避免翻转或强裁剪等破坏车牌文本可读性的操作，从而在维持数据真实分布的前提下提升模型的视角适应性。这一范式有效缓解了小样本过拟合问题，并为后续研究如何在遮挡、光照剧变及复杂背景中维持检测稳定性提供了可复现的基准实验平台。

实际应用

在实际部署层面，该数据集驱动的车牌检测模型已渗透至越南交通管理的多个关键环节。在智能交通监控系统中，检测器可嵌入路侧摄像头前端，实时截取视频流中的车牌区域，为后续的车牌字符识别（LPR）提供高质输入，进而支撑闯红灯抓拍、超速自动稽查及停车费无感支付等场景。针对摩托车占比极高的越南交通生态，模型对倾斜、小尺寸及夜间低照度车牌的检测能力使其能够准确捕获两轮车辆的车牌信息，弥补传统地感线圈仅在固定点位触发的局限。此外，在商业安防领域，该技术被用于小区出入口的访客管理、加油站的自动计费及停车场出入口的无人值守系统，显著降低了人工核对成本并提升了通行效率。数据集的设计者明确提醒商业使用者需关注图像版权与隐私合规性，这也促使应用方在部署时同步思考数据安全与伦理边界。

数据集最近研究