Iranis Dataset

github2024-05-19 更新2024-05-31 收录

下载链接：

https://github.com/alitourani/iclp-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含超过83,000张波斯数字和字母的图像，这些图像是从现实世界的牌照图像中通过各种相机捕获的。

This dataset comprises over 83,000 images of Persian digits and letters, captured from real-world license plate images using various cameras.

创建时间：

2020-05-24

原始信息汇总

Iranis Dataset 概述

数据集简介

Iranis Dataset 是一个大规模的Farsi（波斯语）车牌字符数据集，包含超过83,000张从现实世界车牌图像中捕获的数字和字母图像。

数据集特征

类别	标签 (类名)	字符	实例数量
数字	0	0	2501
数字	1	1	3495
数字	2	2	3930
数字	3	3	2745
数字	4	4	5774
数字	5	5	3610
数字	6	6	5753
数字	7	7	3736
数字	8	8	3583
数字	9	9	3528
字母	A	الف	2517
字母	B	ب	2511
字母	P	پ	2519
字母	J	ج	2505
字母	H	ه	2558
字母	D	د	2504
字母	Sin	س	2445
字母	Sad	ص	2515
字母	T	ط	2512
字母	Gh	ق	2482
字母	L	ل	2502
字母	M	م	2500
字母	N	ن	2558
字母	V	و	2509
字母	Y	ی	2491
字母	PuV (公共车辆)	ع	2508
字母	Taxi	ت	2551
符号	PwD (残疾人)	🦽	2502
总计			83844

数据集可用性

Kaggle: 链接
Data.world: 链接

引用信息

若使用此数据集，请引用以下论文：

@inproceedings{Tourani2021, author = {Tourani, Ali and Soroori, Sajjad and Shahbahrami, Asadollah and Akoushideh, Alireza}, title = {{Iranis: A Large-scale Dataset of Iranian Vehicles License Plate Characters}}, booktitle = {2021 5th International Conference on Pattern Recognition and Image Analysis (IPRIA)}, doi = {10.1109/IPRIA53572.2021.9483461}, isbn = {978-1-6654-2659-6}, pages = {1--5}, publisher = {IEEE}, url = {https://ieeexplore.ieee.org/document/9483461/}, year = {2021} }

搜集汇总

数据集介绍

构建方式

Iranis数据集的构建基于大规模的真实世界波斯语车牌图像，通过多种摄像头采集，涵盖了超过83,000张图像。这些图像包含了波斯语的数字和字母，经过精细的标注和分类，形成了包含数字、字母和特殊符号的多样化数据集。每个类别的实例数量均衡，确保了数据集的广泛适用性。

特点

Iranis数据集的主要特点在于其大规模和多样性，涵盖了波斯语车牌中的所有常见字符，包括数字、字母以及特殊符号。数据集的均衡分布使得各类字符的实例数量相对平均，避免了类别不平衡问题。此外，数据集的图像来源于真实场景，具有较高的实用性和代表性。

使用方法

Iranis数据集适用于车牌识别、字符识别等计算机视觉任务。用户可以通过下载数据集并将其划分为训练集和测试集，利用深度学习模型进行训练和评估。数据集的多样性和均衡性使得模型能够更好地泛化到实际应用场景中。此外，数据集还提供了详细的类别信息和实例数量，便于用户进行数据分析和模型优化。

背景与挑战

背景概述

Iranis数据集是一个大规模的波斯语车牌字符图像数据集，由Ali Tourani等人于2021年创建，旨在推动波斯语车牌字符识别的研究。该数据集包含了超过83,000张从真实车牌图像中提取的波斯数字和字母图像，涵盖了从0到9的数字以及20个波斯字母和符号。该数据集的构建得到了吉兰大学技术孵化中心、吉兰科技园以及DadeKavan Khazar Pouya公司的支持，并由研究生和本科生共同参与数据采集和标注工作。Iranis数据集的发布为波斯语车牌识别领域的研究提供了宝贵的资源，推动了该领域的技术进步。

当前挑战

Iranis数据集在构建过程中面临了多重挑战。首先，波斯语车牌字符的多样性和复杂性使得数据采集和标注工作变得尤为困难，尤其是不同字体、光照条件和拍摄角度的影响。其次，数据集的规模和多样性要求高效的图像处理和标注工具，以确保数据的准确性和一致性。此外，波斯语字符的独特性使得现有的字符识别算法难以直接应用，需要开发专门针对波斯语车牌的识别模型。这些挑战不仅考验了数据集构建的技术能力，也对后续的算法研究和应用提出了更高的要求。

常用场景

经典使用场景

Iranis数据集在车牌字符识别领域展现了其卓越的应用潜力。该数据集包含了超过83,000张来自真实车牌图像的波斯数字和字母图片，为深度学习模型提供了丰富的训练样本。通过利用这一大规模数据集，研究者能够构建和优化车牌字符识别模型，从而在自动车牌识别（ANPR）系统中实现高精度的字符分类与识别。

解决学术问题

Iranis数据集有效解决了波斯车牌字符识别中的多重学术挑战。首先，它填补了波斯语车牌字符数据集的空白，为相关研究提供了宝贵的资源。其次，通过提供多样化的字符样本，该数据集有助于提升模型对不同字体、光照条件和噪声的鲁棒性，推动了车牌识别技术的进步。此外，该数据集的公开共享促进了跨学科合作，为图像处理和模式识别领域的研究者提供了新的研究方向。

衍生相关工作

基于Iranis数据集，研究者们开展了多项相关工作，进一步推动了车牌字符识别技术的发展。例如，有研究利用该数据集训练卷积神经网络（CNN）模型，显著提升了波斯车牌字符的识别精度。此外，一些工作还探索了数据增强技术，以应对数据集中样本分布不均的问题。这些衍生研究不仅丰富了车牌识别领域的理论基础，还为实际应用提供了更为可靠的技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集