China License Plate Dataset|车牌识别数据集|图像标注数据集

github2024-05-17 更新2024-05-31 收录

车牌识别

图像标注

下载链接：

https://github.com/wangpengnorman/CLPD_dataset

下载链接

链接失效反馈

资源简介：

该数据集包含从互联网搜索、手机拍摄或车载记录仪捕获的多种真实场景下的车牌图像。数据集涵盖了不同拍摄角度、时间、分辨率和背景条件，包括多种车辆类型如卡车、轿车、警车和新能源车辆。新能源车辆车牌有八个字母，其他车辆车牌有七个字母，允许部分遮挡的车牌。所有图像均手动标注了边界框和车牌字母。数据集包含来自中国大陆31个省份的1200张车牌图像。

This dataset comprises a diverse collection of license plate images captured from various real-world scenarios, including internet searches, mobile phone photography, and vehicle-mounted dashcams. It encompasses a wide range of shooting angles, times, resolutions, and background conditions, featuring multiple vehicle types such as trucks, sedans, police cars, and new energy vehicles. License plates for new energy vehicles consist of eight characters, while those for other vehicles have seven characters, with partial occlusions permitted. All images have been manually annotated with bounding boxes and license plate characters. The dataset includes 1,200 license plate images from 31 provinces across mainland China.

创建时间：

2020-06-02

原始信息汇总

CLPD_dataset (China License Plate Dataset)

描述

CLPD数据集包含的牌照图像来自多种真实场景，如互联网搜索、手机拍摄或车载记录仪捕捉。拍摄时考虑了多种角度、时间、分辨率和背景，以涵盖不同条件。

数据集包含多种车辆类型，如卡车、轿车、警车和新能源车辆。新能源车辆牌照为八位字母，其他车辆为七位字母，且允许包含遮挡的牌照。这些变化增加了识别难度，使得基于规则的识别方法不适用。

所有牌照图像的边界框和字母均通过人工标注。

数据集信息

图像数量：1200张
覆盖地区：中国大陆31个省份
车辆类型：卡车、轿车、警车、新能源车辆
牌照特点：新能源车辆牌照八位字母，其他七位字母，允许遮挡
标注方式：人工标注边界框和字母

下载与使用

下载链接：BaiduYun Drive(code: dt11)
标注信息：CLPD.csv文件，包含图片路径、四个角点坐标及标签
标签编码：Windows 10下为‘GBK’格式，Linux系统需转换为‘UTF-8’格式

AI搜集汇总

数据集介绍

构建方式

China License Plate Dataset（CLPD）的构建基于多样化的真实场景图像来源，包括互联网搜索、手机拍摄以及车载记录仪捕捉的图像。为确保数据集的广泛适用性，拍摄角度、时间、分辨率和背景均进行了多样化处理，涵盖了不同条件下的车牌图像。此外，数据集包含了多种车辆类型，如卡车、轿车、警车和新能源车，其中新能源车的车牌长度为八个字母，而其他车辆则为七个字母。为增加识别难度，数据集还包含了部分遮挡的车牌，这些车牌可见字母少于七个。所有图像的车牌边界框和字母均通过人工标注，确保了数据集的高质量。

特点

CLPD数据集的显著特点在于其多样性和复杂性。首先，数据集涵盖了中国大陆31个省份的1200张车牌图像，确保了地域的广泛代表性。其次，数据集包含了不同车辆类型和车牌长度，特别是新能源车的八位字母车牌，增加了识别算法的挑战性。此外，数据集还包含了部分遮挡的车牌，进一步提升了识别难度，使得基于规则的识别方法不再适用。这些特点使得CLPD数据集成为车牌识别研究中的宝贵资源。

使用方法

使用CLPD数据集时，用户需从提供的百度云链接下载数据集，并注意标注信息存储在CLPD.csv文件中，每行包含图像路径、四个角点的坐标以及车牌标签。标签以GBK格式编码，若在Linux系统中使用，需将其转换为UTF-8格式。数据集适用于车牌识别算法的训练和测试，尤其适合处理复杂场景和遮挡情况下的车牌识别问题。如有疑问，用户可通过电子邮件联系数据集提供者获取支持。

背景与挑战

背景概述

中国车牌数据集（China License Plate Dataset, CLPD）是由西北工业大学张林江教授团队创建的，旨在为车牌识别技术提供一个全面且多样化的数据资源。该数据集收集了来自中国大陆31个省份的1200张车牌图像，涵盖了多种车辆类型，包括卡车、轿车、警车和新能源车。特别地，新能源车的车牌由八个字母组成，而其他车辆的车牌则由七个字母组成，这种差异增加了识别的复杂性。此外，数据集还包括了部分遮挡的车牌图像，进一步提升了识别难度。通过手动标注车牌的边界框和字母，CLPD数据集为车牌识别算法的研究和开发提供了宝贵的资源。

当前挑战

CLPD数据集在构建过程中面临了多重挑战。首先，车牌图像的多样性，包括不同的拍摄角度、时间、分辨率和背景，增加了数据集的复杂性。其次，新能源车与其他车辆车牌字母长度的差异，使得基于规则的识别方法变得不可行。此外，部分遮挡的车牌图像进一步提升了识别的难度。最后，数据集中的标注信息以GBK格式存储，在不同操作系统间的兼容性问题也需要解决。这些挑战不仅反映了车牌识别技术的复杂性，也为未来的研究提供了丰富的探索空间。

常用场景

经典使用场景

在智能交通系统中，China License Plate Dataset（CLPD）数据集被广泛应用于车牌识别（LPR）技术的研发与优化。该数据集包含了从互联网、手机拍摄以及车载记录仪等多种真实场景中收集的车牌图像，涵盖了不同角度、时间、分辨率和背景条件。通过这些多样化的图像，研究人员能够训练和验证车牌识别算法在各种复杂环境下的鲁棒性和准确性。

衍生相关工作

基于CLPD数据集，研究人员开发了多种车牌识别算法和模型，推动了相关领域的技术进步。例如，一些研究工作利用该数据集进行深度学习模型的训练，显著提高了车牌识别的准确率。此外，还有研究者基于该数据集开发了针对特定场景（如夜间或恶劣天气）的车牌识别解决方案，进一步扩展了数据集的应用范围。这些衍生工作不仅丰富了车牌识别技术的研究内容，也为实际应用提供了更多可能性。

数据集最近研究

最新研究方向

近年来，中国车牌数据集（China License Plate Dataset, CLPD）在智能交通和计算机视觉领域引起了广泛关注。该数据集通过收集自互联网、手机拍摄及车载记录仪等多种真实场景图像，涵盖了不同拍摄角度、时间和分辨率，以及多样化的背景，为车牌识别技术的研究提供了丰富的数据支持。特别是，数据集中包含了多种车辆类型，如卡车、轿车、警车和新能车，其中新能车的车牌长度与其他车辆不同，增加了识别难度，使得基于规则的识别方法不再适用。此外，数据集还包含了部分遮挡车牌的图像，进一步提升了研究的挑战性。这些特性使得CLPD数据集在车牌识别、图像处理和深度学习等前沿研究中具有重要意义，推动了相关技术的创新与发展。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像，每张图像均给出对应的人名，共有5749人，且绝大部分人仅有一张图片。每张图片的尺寸为250X250，绝大部分为彩色图像，但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国1km分辨率逐月降水量数据集（1901-2023）

该数据集为中国逐月降水量数据，空间分辨率为0.0083333°（约1km），时间为1901.1-2023.12。数据格式为NETCDF，即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集，通过Delta空间降尺度方案在中国降尺度生成的。并且，使用496个独立气象观测点数据进行验证，验证结果可信。本数据集包含的地理空间范围是全国主要陆地（包含港澳台地区），不含南海岛礁等区域。为了便于存储，数据均为int16型存于nc文件中，降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理，Matlab发布了读入与存储nc文件的函数，读取函数为ncread，切换到nc文件存储文件夹，语句表达为：ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent])，其中XXX.nc为文件名，为字符串需要’’；var是从XXX.nc中读取的变量名，为字符串需要’’；i、j、t分别为读取数据的起始行、列、时间，leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样，研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令，可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息，涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

Amazon Product Data

该数据集包含亚马逊产品的详细信息，包括产品规格、价格、折扣、客户评价和用户评分等字段。

github 收录