VN Vietnamese License Plate Dataset YOLO
收藏数据集概述:越南车牌号数据集(YOLO格式)
该数据集专为越南车牌检测任务设计,由作者 franceto (ANH PHAP TO) 构建和维护,托管于 GitHub。
📌 核心信息
- 任务类型:目标检测(Object Detection),具体为检测越南车牌。
- 数据来源:通过手动方式从 Google Images 收集。
- 标注工具:使用 Roboflow 平台进行手动标注。
- 数据格式:YOLO Bounding Box 格式(.txt 标签文件)。
- 类别:仅有 1 个类别,类别名为
Bien-so。 - 总样本数:原始图像数量为 728 张,包含 964 个边界框。
- 数据划分:按 70% / 20% / 10% 的比例分为训练集、验证集和测试集。
- 训练集:509 张图像
- 验证集:146 张图像
- 测试集:73 张图像
🛠️ 技术栈与处理流程
- 使用技术:Google Images(数据收集)、Roboflow(标注与导出)、Python(预处理)、Albumentations(数据增强)、Jupyter Notebook(实验与流程开发)。
- 数据预处理流程:图像收集 → 去重 → 手动标注 → 导出为 YOLO 格式 → 转换标签(如有需要) → 数据质量检查 → 划分数据集 → 仅对训练集进行数据增强 → 最终发布。
🎯 数据特点与适用场景
- 多样性:图像包含多种场景、角度、距离、光照条件(白天/夜晚/背光/眩光)以及复杂背景。部分车牌存在倾斜、模糊或被部分遮挡的情况。
- 数据增强:仅对训练集应用了轻微增强策略,包括随机亮度/对比度、轻微色调/饱和度、轻微模糊、缩放、平移和小于 ±5 度的旋转。未使用水平/垂直翻转、强旋转或可能破坏车牌特征的剪裁/遮挡操作。
- 适用场景:
- 训练 YOLOv8、v9、v11 等车牌检测模型。
- 目标检测数据标注实践。
- 基于 YOLO 的计算机视觉流程开发。
- 车牌识别任务的测试数据。
📁 数据集结构与使用
-
目录结构:
dataset/ ├── data.yaml ├── train/ │ ├── images/ │ └── labels/ ├── val/ │ ├── images/ │ └── labels/ └── test/ ├── images/ └── labels/
-
标签格式:每行代表一个边界框,格式为
class_id x_center y_center width height(数值已归一化)。示例:0 0.512345 0.634211 0.214532 0.092415。 -
配置文件:
data.yaml文件内容如下,可直接用于 YOLO 训练。 yaml train: train/images val: val/images test: test/imagesnc: 1 names: [Bien-so]
-
使用示例(来自 README): bash
训练 YOLOv8n 模型
yolo detect train model=yolov8n.pt data=dataset/data.yaml imgsz=640 epochs=100 batch=16
验证模型
yolo detect val model=runs/detect/train/weights/best.pt data=dataset/data.yaml
预测新图像
yolo detect predict model=runs/detect/train/weights/best.pt source=path/to/image.jpg
⚙️ 运行环境依赖
项目需要以下 Python 库:ultralytics、opencv-python、albumentations、matplotlib、pandas、pillow。
⚠️ 注意事项
该数据集仅供学习、研究和实践计算机视觉使用。若用于商业产品或学术发表,建议自行核查图像版权、隐私及数据来源等问题。




