five

CCPD|车牌识别数据集|数据集数据集

收藏
github2023-10-09 更新2024-05-31 收录
车牌识别
数据集
下载链接:
https://github.com/Fanstuck/Yolov7-LPRNet
下载链接
链接失效反馈
资源简介:
CCPD是一个大型的、多样化的、经过仔细标注的中国城市车牌开源数据集。CCPD数据集主要分为CCPD2019数据集和CCPD2020(CCPD-Green)数据集。CCPD2019数据集车牌类型仅有普通车牌(蓝色车牌),CCPD2020数据集车牌类型仅有新能源车牌(绿色车牌)。在CCPD数据集中,每张图片仅包含一张车牌,车牌的车牌省份主要为皖。CCPD中的每幅图像都包含大量的标注信息,但是CCPD数据集没有专门的标注文件,每张图像的文件名就是该图像对应的数据标注。

CCPD is a large-scale, diverse, and meticulously annotated open-source dataset of Chinese urban license plates. The CCPD dataset is primarily divided into the CCPD2019 dataset and the CCPD2020 (CCPD-Green) dataset. The CCPD2019 dataset contains only standard license plates (blue plates), while the CCPD2020 dataset exclusively features new energy vehicle license plates (green plates). In the CCPD dataset, each image contains only one license plate, with the majority of the plates originating from the Anhui province. Each image in CCPD is accompanied by extensive annotation information; however, the dataset does not include a dedicated annotation file. Instead, the filename of each image serves as the corresponding data annotation.
创建时间:
2023-10-07
原始信息汇总

数据集概述

数据集名称

  • CCPD

数据集来源

数据集特点

  • 多样性:CCPD是一个大型的、多样化的中国城市车牌开源数据集。
  • 标注信息:每张图片仅包含一张车牌,车牌省份主要为皖。每幅图像包含大量标注信息,文件名即为其数据标注。
  • 车牌类型
    • CCPD2019:仅包含普通车牌(蓝色车牌)。
    • CCPD2020(CCPD-Green):仅包含新能源车牌(绿色车牌)。

标注方法

  • 数据发布者首先手动标记10k图像的四个顶点位置,然后设计基于深度学习的检测模型进行自动标注。

数据集用途

  • 用于训练和验证基于Yolov7-LPRNet的动态车牌目标识别算法模型。
AI搜集汇总
数据集介绍
main_image_url
构建方式
CCPD数据集的构建过程体现了高度的自动化和精确性。数据发布者首先在10,000张图像上手动标注了车牌的四个顶点位置,随后利用深度学习模型对这些顶点进行自动标注。这种半自动化的标注方式不仅提高了标注效率,还确保了标注的准确性。数据集中的每张图像仅包含一张车牌,且车牌省份主要为皖,确保了数据的一致性和代表性。
特点
CCPD数据集以其大规模和多样性著称,涵盖了普通车牌和新能源车牌两种类型。每张图像的文件名包含了丰富的标注信息,尽管没有专门的标注文件,但通过文件名即可获取车牌的关键信息。数据集的标注信息包括车牌的四个顶点位置,这为车牌检测和识别任务提供了精确的几何信息。此外,数据集的多样性和广泛性使其成为车牌识别领域的重要资源。
使用方法
使用CCPD数据集进行车牌识别任务时,首先需要将数据集划分为训练集、验证集和测试集。接着,通过修改YOLO配置文件中的参数,如类别数量、模型深度和卷积通道缩放因子,以适应特定的车牌检测任务。训练过程中,可以根据硬件条件调整批量大小和工作线程数,以优化训练效率。训练完成后,利用训练好的模型权重进行推理,即可对图像或视频中的车牌进行检测和识别。
背景与挑战
背景概述
CCPD数据集是中国城市车牌识别领域的重要开源数据集,由detectRecog团队于2019年首次发布,并于2020年扩展了新能源车牌数据。该数据集主要包含CCPD2019和CCPD2020两个子集,分别涵盖普通蓝色车牌和新能源绿色车牌。CCPD数据集的创建旨在解决车牌识别中的多样性和复杂性挑战,特别是在中国城市环境中,车牌类型、光照条件和拍摄角度等因素的多样性对识别算法提出了更高的要求。数据集的标注信息直接嵌入图像文件名中,极大简化了数据处理的流程。CCPD的发布显著推动了车牌识别算法的研究与应用,尤其在基于深度学习的车牌检测与识别领域具有广泛影响力。
当前挑战
CCPD数据集在构建与应用过程中面临多重挑战。首先,车牌识别领域的复杂性要求数据集具备高度的多样性和代表性,而CCPD虽然涵盖了多种车牌类型,但其样本主要集中在安徽省车牌,可能限制了模型的泛化能力。其次,数据标注过程中,车牌四个顶点的精确定位是技术难点,初期依赖人工标注,后期通过深度学习模型进行自动化标注,这一过程对标注精度和模型性能提出了较高要求。此外,CCPD数据集缺乏专门的标注文件,依赖文件名存储标注信息,虽然简化了数据处理,但也增加了数据解析的复杂性。最后,车牌识别算法的实际应用场景中,光照变化、遮挡和拍摄角度等因素对模型的鲁棒性提出了更高要求,如何基于CCPD数据集训练出适应复杂环境的模型仍是一个亟待解决的问题。
常用场景
经典使用场景
CCPD数据集在车牌识别领域具有广泛的应用,尤其是在中国城市交通管理中。该数据集通过提供大量经过精细标注的车牌图像,支持了基于深度学习的车牌检测与识别算法的开发与优化。研究人员可以利用CCPD数据集训练和验证车牌检测模型,如YOLOv7等,以实现高精度的车牌定位与字符识别。
实际应用
在实际应用中,CCPD数据集被广泛用于智能交通系统、停车场管理和车辆监控等领域。基于该数据集训练的车牌识别模型能够高效地处理实时视频流,自动检测和识别车牌信息,从而提升交通管理的自动化水平。此外,CCPD数据集还为新能源车牌的识别提供了专门的支持,满足了绿色车牌识别这一新兴需求。
衍生相关工作
CCPD数据集的发布催生了一系列相关研究工作,尤其是在车牌检测与识别算法的改进方面。例如,基于CCPD数据集的YOLOv7-LPRNet模型结合了目标检测与字符识别技术,显著提升了车牌识别的准确率。此外,CCPD数据集还推动了车牌识别领域的数据增强、模型压缩和跨域适应等研究方向的发展,为学术界和工业界提供了重要的研究基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录

中性笔商品在不同地区天猫平台的销售渗透率分析数据

销售渗透率通常定义为特定产品在潜在市场中的占有率。对公司天猫平台上中性笔商品在不同地区的销售渗透率进行分析,对于理解中性笔商品在不同地区的市场发展趋势、识别商品在不同地区的增长机会和潜在风险、指导公司选品规划和商品定价以及优化资源配置,具有重要的统计意义和实际应用价值。本数据也可为中性笔商品的供应商(生产厂商)和其他销售商同行在市场进入、产品开发、定价策略等方面提供参考。1.数据收集和预处理:(1)数据收集:收集公司在天猫平台上销售的中性笔商品在不同地区每季度的销售统计信息,具体包括商品类目、商品名称、销售渠道/平台、统计区域、统计年份和季度、本季度内单月最高销量、本季度内单月最低销量、本季度平均月销量。(2)数据预处理:对采集到的原始数据进行处理,去除缺失和异常数据。 2.建立销售渗透率分析模型:(1)计算本季度月均潜在销量:本季度月均潜在销量=本季度内单月最高销量-本季度内单月最低销量+本季度平均月销量;(2)计算本季度月均销售渗透率:本季度月均销售渗透率=(本季度平均月销量/本季度月均潜在销量)*100%;(3)销售渗透率分析:基于计算出的销售渗透率,根据区县划分不同的类别和级别,≥90%以上标记为“销售渗透率高”,50%-90%区间(不含50%和90%)内标记为“销售渗透率中等”,≤50%标记为“销售渗透率低”。分界线90%和50%通过公司内部与行业专家研讨确定。

浙江省数据知识产权登记平台 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录