five

LRLPR-26

收藏
arXiv2026-04-24 更新2026-04-28 收录
下载链接:
https://icpr26lrlpr.github.io/
下载链接
链接失效反馈
官方服务:
资源简介:
LRLPR-26数据集由巴拉那联邦大学等机构联合构建,是首个专注于真实低分辨率车牌识别的公开数据集。该数据集包含20,000条训练轨迹和3,000条测试轨迹,每条训练轨迹包含同一车牌的5张低分辨率图像和5张高分辨率图像,总计23万张图像。数据通过安装在巴西的监控摄像头采集,覆盖昼夜及雨天等多种真实场景,并采用YOLOv11检测和BoT-SORT跟踪技术构建。该数据集旨在推动复杂场景下车牌识别算法的研究,可应用于智能交通、执法取证等领域,解决低分辨率、高压缩等实际挑战。
提供机构:
巴拉那联邦大学; 巴拉那天主教大学; 高丽大学; 信息技术大学; 胡志明市理工大学; 越南国立大学; 复旦大学; 上海多模态具身智能重点实验室; 韩东全球大学
创建时间:
2026-04-24
搜集汇总
数据集介绍
main_image_url
构建方式
LRLPR-26数据集是为ICPR 2026低分辨率车牌识别挑战赛而构建的大规模基准数据集。其构建源于真实监控场景下的视频采集:摄像机安装在巴西库里蒂巴的联邦巴拉那大学,以1920×1080分辨率录制车辆进出道路的视频序列。采用YOLOv11检测器对车牌进行检测,并通过BoT-SORT算法进行跨帧跟踪。针对每辆车,从距相机最远的五帧中提取低分辨率图像,从最近的五帧中提取高分辨率图像。训练集包含20,000个轨迹,每个轨迹含五张低分辨率和五张高分辨率图像,共计200,000张图像;测试集包含3,000个轨迹,仅含低分辨率图像。数据集涵盖巴西和南方共同市场两种车牌布局,并融合了不同环境条件(如白天、雨天和夜间),由半自动OCR标注并经人工校验确保标注可靠性。
特点
LRLPR-26数据集具有显著特点。它是首个专为低分辨率车牌识别设计的大规模真实低质数据集,包含20,000个训练轨迹和3,000个测试轨迹,每个轨迹对应同一车牌的连续多帧图像,为多帧融合策略提供了天然支撑。数据集包含真实高低分辨率图像对,鼓励超分辨率等图像增强方法的探索。其收集场景涵盖白天、雨天和夜间等多种真实监控条件,且测试集与训练集完全无重叠,确保了评估的公正性。该数据集吸引了来自41个国家269支队伍参赛,其82.13%的最高识别率表明任务仍具挑战性,体现了被广泛认可的难度与研究价值。
使用方法
该数据集适用于低分辨率车牌识别任务的研究与评估。研究者可采用数据集提供的训练轨迹,利用每辆车对应的五张低分辨率图像与五张高分辨率图像对,设计超分辨率与文字识别联合模型。在测试阶段,需仅凭每个轨迹的五张低分辨率图像预测车牌文本。参与者可自由选择多帧预测的融合策略,如多数投票、置信度加权或时序建模。官方评估指标为识别率,要求预测结果与真实文本完全匹配,并使用置信度差距作为平局准则。竞赛的提交格式要求为每个轨迹输出文本串及置信度分数。该数据集还鼓励结合外部公开数据集训练,以探索更鲁棒的解决方案。
背景与挑战
背景概述
在现实监控场景中,由于拍摄距离遥远、压缩伪影以及恶劣成像条件的影响,车牌字符往往严重退化,使得低分辨率车牌识别(LRLPR)成为一项极具挑战性的任务。为推进该领域的发展,由巴西巴拉那联邦大学、韩国高丽大学、越南信息科技大学、中国复旦大学等多家机构的研究者共同发起了ICPR 2026低分辨率车牌识别竞赛,这是首个专门针对真实低质量数据的LRLPR国际竞赛。竞赛基于LRLPR-26数据集,该数据集包含20,000个训练轨迹和3,000个测试轨迹,每个轨迹提供同一车牌的五张低分辨率与五张高分辨率图像。竞赛吸引了来自41个国家的269支团队参与,最终仅有99支团队提交有效结果,冠军识别率达到82.13%,彰显了该数据集对推动低分辨率车牌识别技术发展的重要意义。
当前挑战
该领域面临的核心挑战在于,真实监控环境中捕捉的车牌图像分辨率极低,加之压缩伪影、运动模糊、光照变化及部分遮挡等因素,使得字符轮廓模糊、难以辨识,传统在高质量图像上表现优异的识别模型在此类场景中识别率常低于50-60%。此外,多数现有研究依赖对高分辨率样本进行双三次下采样等简单退化模拟,无法复现真实场景中复杂的退化模式。在构建数据集时,挑战同样严峻:需要从行驶车辆中同步获取同一车牌的低分辨率与高分辨率图像对,并确保轨迹关联的准确性;同时,半自动标注过程中使用OCR模型生成的转录结果需要人工逐一核查修正,工作量巨大;为扩充场景多样性,还需在雨天、夜间等苛刻条件下持续采集数据,进一步增加了构建难度。
常用场景
经典使用场景
在智能交通与公共安全领域,车牌识别系统常因摄像头硬件限制、远距离拍摄或数据压缩等因素,导致监控图像中车牌区域分辨率极低、字符模糊难辨。LRLPR-26数据集正是为攻克这一现实困境而生,其经典使用场景聚焦于低分辨率车牌识别(LRLPR)任务的训练与评测。该数据集囊括20,000组训练轨迹与3,000组测试轨迹,每组轨迹包含同一车牌的五帧低分辨率与五帧高分辨率图像,为模型提供了从低质量影像中精准复原并识别字符的宝贵监督信号。研究者可借此探索超分辨率复原与文字识别的协同策略,亦可独立评估识别模型在极端退化条件下的鲁棒性,从而推动低质量监控场景下车牌识别技术的实质性突破。
解决学术问题
LRLPR-26数据集着力解决了学术界长期面临的真实低分辨率车牌识别基准缺失问题。此前多数研究依赖人工合成降质图像,无法模拟现实监控中复杂的压缩伪影、光照变化与运动模糊,导致模型在实战场景中性能骤降。该数据集通过在同一车辆经由远、近摄像头采集的低、高分辨率图像对,首次构建了大规模真实低质车牌识别基准,为公平评估与横向对比提供了标准化平台。其发布直接促成了ICPR 2026专题竞赛,吸引全球269支团队参与,冠军识别率仅为82.13%,揭示了当前方法的性能上限与巨大提升空间,有力推动了低质图像文字识别领域的学术探索。
衍生相关工作
围绕LRLPR-26数据集衍生了一系列具有代表性的研究工作。竞赛中,冠军队提出教师-学生联合训练框架,将超分辨率模型与OCR模型协同优化,并利用指数移动平均更新教师参数(DLmath方案);亚军队则采用四阶段流水线,融合空间变换网络、SE-ResNet特征提取与CTC解码,通过加权对数概率平均实现多帧融合(AIO_JiangnamCoffee方案)。此外,基于该数据集的后续研究还探索了字符级别置信度投票(OpenOCR方案)、布局感知的双流识别与位置集成策略(CAP2方案),以及结构知晓的约束解码(UIT-MeoBeo方案),这些工作共同丰富了低分辨率车牌识别的技术路线与理论体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作