five

China License Plate Dataset|车牌识别数据集|图像标注数据集

收藏
github2024-05-17 更新2024-05-31 收录
车牌识别
图像标注
下载链接:
https://github.com/wangpengnorman/CLPD_dataset
下载链接
链接失效反馈
资源简介:
该数据集包含从互联网搜索、手机拍摄或车载记录仪捕获的多种真实场景下的车牌图像。数据集涵盖了不同拍摄角度、时间、分辨率和背景条件,包括多种车辆类型如卡车、轿车、警车和新能源车辆。新能源车辆车牌有八个字母,其他车辆车牌有七个字母,允许部分遮挡的车牌。所有图像均手动标注了边界框和车牌字母。数据集包含来自中国大陆31个省份的1200张车牌图像。

This dataset comprises a diverse collection of license plate images captured from various real-world scenarios, including internet searches, mobile phone photography, and vehicle-mounted dashcams. It encompasses a wide range of shooting angles, times, resolutions, and background conditions, featuring multiple vehicle types such as trucks, sedans, police cars, and new energy vehicles. License plates for new energy vehicles consist of eight characters, while those for other vehicles have seven characters, with partial occlusions permitted. All images have been manually annotated with bounding boxes and license plate characters. The dataset includes 1,200 license plate images from 31 provinces across mainland China.
创建时间:
2020-06-02
原始信息汇总

CLPD_dataset (China License Plate Dataset)

描述

CLPD数据集包含的牌照图像来自多种真实场景,如互联网搜索、手机拍摄或车载记录仪捕捉。拍摄时考虑了多种角度、时间、分辨率和背景,以涵盖不同条件。

数据集包含多种车辆类型,如卡车、轿车、警车和新能源车辆。新能源车辆牌照为八位字母,其他车辆为七位字母,且允许包含遮挡的牌照。这些变化增加了识别难度,使得基于规则的识别方法不适用。

所有牌照图像的边界框和字母均通过人工标注。

数据集信息

  • 图像数量:1200张
  • 覆盖地区:中国大陆31个省份
  • 车辆类型:卡车、轿车、警车、新能源车辆
  • 牌照特点:新能源车辆牌照八位字母,其他七位字母,允许遮挡
  • 标注方式:人工标注边界框和字母

下载与使用

  • 下载链接BaiduYun Drive(code: dt11)
  • 标注信息:CLPD.csv文件,包含图片路径、四个角点坐标及标签
  • 标签编码:Windows 10下为‘GBK’格式,Linux系统需转换为‘UTF-8’格式
AI搜集汇总
数据集介绍
main_image_url
构建方式
China License Plate Dataset(CLPD)的构建基于多样化的真实场景图像来源,包括互联网搜索、手机拍摄以及车载记录仪捕捉的图像。为确保数据集的广泛适用性,拍摄角度、时间、分辨率和背景均进行了多样化处理,涵盖了不同条件下的车牌图像。此外,数据集包含了多种车辆类型,如卡车、轿车、警车和新能源车,其中新能源车的车牌长度为八个字母,而其他车辆则为七个字母。为增加识别难度,数据集还包含了部分遮挡的车牌,这些车牌可见字母少于七个。所有图像的车牌边界框和字母均通过人工标注,确保了数据集的高质量。
特点
CLPD数据集的显著特点在于其多样性和复杂性。首先,数据集涵盖了中国大陆31个省份的1200张车牌图像,确保了地域的广泛代表性。其次,数据集包含了不同车辆类型和车牌长度,特别是新能源车的八位字母车牌,增加了识别算法的挑战性。此外,数据集还包含了部分遮挡的车牌,进一步提升了识别难度,使得基于规则的识别方法不再适用。这些特点使得CLPD数据集成为车牌识别研究中的宝贵资源。
使用方法
使用CLPD数据集时,用户需从提供的百度云链接下载数据集,并注意标注信息存储在CLPD.csv文件中,每行包含图像路径、四个角点的坐标以及车牌标签。标签以GBK格式编码,若在Linux系统中使用,需将其转换为UTF-8格式。数据集适用于车牌识别算法的训练和测试,尤其适合处理复杂场景和遮挡情况下的车牌识别问题。如有疑问,用户可通过电子邮件联系数据集提供者获取支持。
背景与挑战
背景概述
中国车牌数据集(China License Plate Dataset, CLPD)是由西北工业大学张林江教授团队创建的,旨在为车牌识别技术提供一个全面且多样化的数据资源。该数据集收集了来自中国大陆31个省份的1200张车牌图像,涵盖了多种车辆类型,包括卡车、轿车、警车和新能源车。特别地,新能源车的车牌由八个字母组成,而其他车辆的车牌则由七个字母组成,这种差异增加了识别的复杂性。此外,数据集还包括了部分遮挡的车牌图像,进一步提升了识别难度。通过手动标注车牌的边界框和字母,CLPD数据集为车牌识别算法的研究和开发提供了宝贵的资源。
当前挑战
CLPD数据集在构建过程中面临了多重挑战。首先,车牌图像的多样性,包括不同的拍摄角度、时间、分辨率和背景,增加了数据集的复杂性。其次,新能源车与其他车辆车牌字母长度的差异,使得基于规则的识别方法变得不可行。此外,部分遮挡的车牌图像进一步提升了识别的难度。最后,数据集中的标注信息以GBK格式存储,在不同操作系统间的兼容性问题也需要解决。这些挑战不仅反映了车牌识别技术的复杂性,也为未来的研究提供了丰富的探索空间。
常用场景
经典使用场景
在智能交通系统中,China License Plate Dataset(CLPD)数据集被广泛应用于车牌识别(LPR)技术的研发与优化。该数据集包含了从互联网、手机拍摄以及车载记录仪等多种真实场景中收集的车牌图像,涵盖了不同角度、时间、分辨率和背景条件。通过这些多样化的图像,研究人员能够训练和验证车牌识别算法在各种复杂环境下的鲁棒性和准确性。
衍生相关工作
基于CLPD数据集,研究人员开发了多种车牌识别算法和模型,推动了相关领域的技术进步。例如,一些研究工作利用该数据集进行深度学习模型的训练,显著提高了车牌识别的准确率。此外,还有研究者基于该数据集开发了针对特定场景(如夜间或恶劣天气)的车牌识别解决方案,进一步扩展了数据集的应用范围。这些衍生工作不仅丰富了车牌识别技术的研究内容,也为实际应用提供了更多可能性。
数据集最近研究
最新研究方向
近年来,中国车牌数据集(China License Plate Dataset, CLPD)在智能交通和计算机视觉领域引起了广泛关注。该数据集通过收集自互联网、手机拍摄及车载记录仪等多种真实场景图像,涵盖了不同拍摄角度、时间和分辨率,以及多样化的背景,为车牌识别技术的研究提供了丰富的数据支持。特别是,数据集中包含了多种车辆类型,如卡车、轿车、警车和新能车,其中新能车的车牌长度与其他车辆不同,增加了识别难度,使得基于规则的识别方法不再适用。此外,数据集还包含了部分遮挡车牌的图像,进一步提升了研究的挑战性。这些特性使得CLPD数据集在车牌识别、图像处理和深度学习等前沿研究中具有重要意义,推动了相关技术的创新与发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。

国家青藏高原科学数据中心 收录

GlobalBuildingAtlas

GlobalBuildingAtlas是一个公开的全球建筑数据集,提供了全球范围内的建筑多边形、高度和LoD1 3D模型。该数据集是第一个提供高质量的、一致的、完整的建筑数据,以2D和3D形式在单个建筑层面上进行全球覆盖的公开数据集。数据集包括2.75亿座建筑,比目前最全面的数据库多出超过10亿座建筑。GBA.Height提供了迄今为止最详细和最准确的全球3D建筑高度图,实现了3×3米的空间分辨率,比以前的全球产品(90米)精细30倍,能够在本地和全球范围内对建筑体积进行高分辨率和可靠的分析。GBA.LoD1代表了第一个完整的全球LoD1建筑模型,包括2.68亿个建筑实例,具有预测的高度,即高度完整性超过97%,在不同大陆上实现了从1.5米到8.9米的RMSEs。GlobalBuildingAtlas以其高度精度、全面的全球覆盖和丰富的空间细节,为全球建筑现状提供了新的见解,开辟了前所未有的地理空间分析可能性,例如更好地说明人们居住在哪里,以及更全面地监测联合国第11个可持续发展目标的进展。

arXiv 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

RadDet

RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录