five

DGUT_LPR

收藏
github2022-12-17 更新2024-05-31 收录
下载链接:
https://github.com/DGUT-IoT-Lab/DGUT_LPR
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个中国车牌数据集的扩展,通过CycleGAN生成,分为8个类别,解决了原CCPD数据集中字符标注不平衡的问题。数据集包括基础图像、模糊图像、旋转倾斜图像、功能性图像、双层图像、天气影响图像和挑战性图像。

This is an extension of a Chinese license plate dataset, generated through CycleGAN, and divided into 8 categories, addressing the issue of imbalanced character annotations in the original CCPD dataset. The dataset includes basic images, blurred images, rotated and tilted images, functional images, double-layer images, weather-affected images, and challenging images.
创建时间:
2022-06-27
原始信息汇总

DGUT_LPR 数据集概述

数据集来源与改进

DGUT_LPR 数据集是对 CCPD 中国车牌数据集的扩展。通过使用 CycleGAN 生成图像,并将其分为 8 个类别,解决了原始 CCPD 数据集中存在的字符标注不平衡问题。

数据集下载

字符统计

图1展示了原始 CCPD 数据集与生成数据集的字符分布情况,解决了 CCPD 数据集中字符分布不平衡的问题。

Fig.1 Character distribution of CCPD and our generated dataset

数据集分类与数量

类别 基础 模糊 旋转倾斜 倾斜 Fn Db 天气 挑战
数量 10000 2000 2000 2000 2000 2000 1000 807

示例图像

  • 基础: 展示了来自 CCPD 的真实图像及生成的图像。
  • 模糊、旋转倾斜、Fn、Db、天气: 展示了不同条件下的生成图像。
  • 挑战: 展示了具有挑战性的生成图像。

标注信息

  • 文件名示例:35_11_10_16_33_20_14@149_417_339_612@170_417_339_542_318_612_149_487@1_fake.jpg
  • 标注内容包括车牌号码、边界框、角点坐标及未来支持的车牌类型类别索引。

字符映射表

  • 提供了从车牌字符到数字的映射,包括数字、大写英文字母和中文字符。

车牌类别映射

  • 提供了车牌颜色的类别映射,包括背景、蓝色、绿色、黑色、白色和黄色。
搜集汇总
数据集介绍
main_image_url
构建方式
DGUT_LPR数据集是基于CCPD中文车牌数据集的扩展版本,通过CycleGAN生成图像,解决了原CCPD数据集中字符标注不平衡的问题。数据集被划分为8个类别,包括基础图像、模糊图像、旋转图像、倾斜图像、Fn图像、Db图像、天气图像和挑战图像,每类图像数量分别为10000、2000、2000、2000、2000、2000、1000和807张。
特点
DGUT_LPR数据集的主要特点在于其通过CycleGAN生成的图像,显著改善了原CCPD数据集中字符分布不平衡的问题。数据集提供了详细的字符统计信息,并通过图像示例展示了不同类别图像的质量和多样性。此外,数据集还包含了车牌字符的映射表,便于用户进行字符识别和分类任务。
使用方法
使用DGUT_LPR数据集时,用户可通过Baidu Drive下载数据,解压后即可访问各类图像及其对应的标注信息。标注信息包括车牌号码、边界框坐标和角点坐标,便于进行车牌检测和识别任务。用户还可利用提供的字符映射表,将车牌字符转换为对应的索引值,进一步简化数据处理流程。
背景与挑战
背景概述
DGUT_LPR数据集是基于CCPD(Chinese City Parking Dataset)中文车牌数据集的扩展版本,旨在解决CCPD数据集中字符分布不平衡的问题。该数据集由CycleGAN生成,包含8个类别,涵盖了基础、模糊、旋转、倾斜、Fn、Db、天气和挑战等多种场景。DGUT_LPR的创建时间为近年,主要研究人员或机构未明确提及,但其核心研究问题聚焦于提升车牌字符识别的均衡性与鲁棒性。该数据集通过生成多样化的车牌图像,显著改善了原始CCPD数据集中字符分布不均的缺陷,为车牌识别领域的研究提供了更为丰富的数据支持,推动了相关算法的优化与创新。
当前挑战
DGUT_LPR数据集在解决车牌字符识别问题时面临多重挑战。首先,原始CCPD数据集中字符分布的不均衡性导致模型在训练过程中对某些字符的识别能力较弱,DGUT_LPR通过生成多样化图像缓解了这一问题,但仍需进一步优化生成数据的真实性与多样性。其次,数据集的构建过程中,如何确保生成图像的质量与标注的准确性是一大挑战,尤其是在复杂场景(如模糊、倾斜、天气变化等)下,生成图像的真实性与标注的一致性难以完全保证。此外,数据集的扩展与标注工作需耗费大量人力与计算资源,如何在有限资源下高效完成数据生成与标注,也是构建过程中亟待解决的难题。
常用场景
经典使用场景
DGUT_LPR数据集在车牌识别领域具有广泛的应用,特别是在处理复杂场景下的车牌识别任务时表现出色。该数据集通过CycleGAN生成图像,涵盖了多种车牌变形和干扰情况,如模糊、旋转、倾斜、天气影响等,为车牌识别算法的鲁棒性测试提供了丰富的实验数据。
实际应用
在实际应用中,DGUT_LPR数据集被广泛用于智能交通系统中的车牌识别模块开发。通过该数据集训练的模型能够更好地应对现实场景中的各种干扰因素,如光照变化、车牌污损等,从而提升车牌识别的准确率和稳定性。
衍生相关工作
基于DGUT_LPR数据集,许多经典的车牌识别算法得以优化和验证。例如,一些研究利用该数据集进行深度学习模型的训练,提出了基于注意力机制的车牌识别方法,显著提升了复杂场景下的识别效果。此外,该数据集还促进了车牌生成与识别一体化研究的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作