five

UFPR-VCR|车辆颜色识别数据集|图像识别数据集

收藏
arXiv2024-08-21 更新2024-08-23 收录
车辆颜色识别
图像识别
下载链接:
https://github.com/lima001/ufpr-vcr-dataset
下载链接
链接失效反馈
资源简介:
UFPR-VCR数据集由联邦大学巴拉那创建,包含10,039张图像,涵盖11种车辆颜色,主要用于车辆颜色识别研究。数据集图像来源于巴西的六个公开车牌识别数据集,经过预处理和筛选,确保图像质量符合研究需求。该数据集特别关注于夜间和多视角等复杂场景下的车辆颜色识别,旨在为车辆颜色识别技术的发展提供挑战性数据支持。
提供机构:
联邦大学巴拉那
创建时间:
2024-08-21
原始信息汇总

UFPR-VCR 数据集

概述

UFPR-VCR(UFPR 车辆颜色识别)数据集旨在解决比先前研究中更为复杂的车辆颜色识别场景。该数据集的构建和使用深度学习模型的初步实验结果详见我们的论文《Toward Enhancing Vehicle Color Recognition in Adverse Conditions: A Dataset and Benchmark》。

数据集详情

  • 图像数量:10,039 张
  • 车辆数量:9,502 辆
  • 车辆类别:包括轿车、货车、公交车和卡车
  • 图像条件:涵盖多种真实世界条件,如正面和背面视角、部分遮挡、多样化的光照情况和夜间场景
  • 车辆颜色:涵盖 11 种不同颜色:米色、黑色、蓝色、棕色、灰色、绿色、橙色、红色、银色、白色和黄色
  • 数据来源:来自六个公开数据集,最初为自动车牌识别(ALPR)创建,包括 OpenALPR-BR、RodoSol-ALPR、SSIG-SegPlate、UFOP、UFPR-ALPR 和 Vehicle-Rear
  • 隐私声明:数据源自巴西采集的数据集,车牌仅与车辆相关,不包含车辆驾驶员或车主的公开信息

获取方式

数据集仅供学术研究使用,免费提供给教育或研究机构的非商业用途研究人员。获取数据集需签署许可协议,并通过有效大学邮箱发送请求至 gelima@inf.ufpr.br。

引用

如在研究中使用 UFPR-VCR 数据集,请引用我们的论文:

@inproceedings{lima2024toward, title = {Toward Enhancing Vehicle Color Recognition in Adverse Conditions: A Dataset and Benchmar}, author = {G. E. {Lima} and R. {Laroca} and E. {Santos} and E. {Nascimento Jr.} and D. {Menotti}}, year = {2024}, month = {Sept}, booktitle = {Conference on Graphics, Patterns and Images (SIBGRAPI)}, volume = {}, number = {}, pages = {1-6}, doi = {}, issn = {1530-1834}, }

AI搜集汇总
数据集介绍
main_image_url
构建方式
UFPR-VCR数据集的构建基于六个巴西车牌识别数据集,涵盖了多种真实场景下的车辆图像。这些图像经过预处理,包括车辆裁剪和图像选择,确保每张图像都适合车辆颜色识别任务。数据集中的图像被分为11种颜色类别,并通过官方车辆注册信息验证了颜色标注的准确性。最终,数据集包含10,039张图像,涵盖了不同的光照条件、视角和夜间场景,旨在提供一个更具挑战性的车辆颜色识别基准。
特点
UFPR-VCR数据集的特点在于其多样性和复杂性。数据集中的图像涵盖了多种真实场景,包括不同的光照条件、视角、部分遮挡以及夜间场景。这些图像被分为11种颜色类别,且颜色分布不均衡,反映了现实世界中车辆颜色的分布情况。此外,数据集中的图像来源于多个公开数据集,确保了场景的多样性和挑战性,尤其是在夜间和复杂光照条件下的识别任务。
使用方法
UFPR-VCR数据集的使用方法主要包括数据预处理、模型训练和性能评估。首先,图像被裁剪并标准化为224×224像素,以适配深度学习模型的输入要求。在训练过程中,采用了数据增强技术,如旋转、缩放、亮度调整等,以提高模型的泛化能力。此外,针对数据集中颜色分布不均衡的问题,采用了过采样技术来平衡训练数据。最后,通过多个深度学习模型(如EfficientNet-V2、MobileNet-V3、ResNet-34和ViT b16)对数据集进行基准测试,评估其在复杂场景下的车辆颜色识别性能。
背景与挑战
背景概述
UFPR-VCR数据集由巴西联邦巴拉那大学信息学系的研究团队于2024年创建,旨在解决车辆颜色识别(VCR)在复杂场景下的挑战。该数据集包含10,039张图像,涵盖了11种车辆颜色,图像来源于巴西的六个车牌识别数据集,涵盖了多种真实场景,如夜间、不同视角和光照条件。UFPR-VCR的创建填补了现有数据集在复杂场景下的不足,推动了车辆颜色识别领域的研究。该数据集不仅为VCR任务提供了更具挑战性的基准,还为细粒度车辆分类提供了新的研究方向。
当前挑战
UFPR-VCR数据集在解决车辆颜色识别问题时面临多重挑战。首先,现有数据集大多在简单场景下表现良好,但在复杂场景(如夜间、部分遮挡、不同视角)下表现不佳,UFPR-VCR通过引入这些复杂场景,显著提升了任务的难度。其次,数据集的构建过程中,研究人员面临图像预处理和标注的挑战,特别是在夜间图像和部分遮挡车辆的颜色识别上,标注的准确性难以保证。此外,数据集中车辆颜色的分布不均衡,导致模型在少数颜色类别上的表现较差。这些挑战为未来的研究提供了方向,特别是在夜间场景下的颜色识别和数据集平衡问题上。
常用场景
经典使用场景
UFPR-VCR数据集主要用于车辆颜色识别(VCR)任务,特别是在复杂环境下的识别挑战。该数据集包含了多种真实场景下的车辆图像,如夜间、不同视角、部分遮挡等,能够有效模拟现实世界中的复杂条件。研究人员通过该数据集可以评估和优化深度学习模型在复杂环境下的颜色识别能力,尤其是在光照不均、视角变化等不利条件下的表现。
解决学术问题
UFPR-VCR数据集解决了现有车辆颜色识别数据集在复杂场景下的不足问题。传统数据集多集中在光照良好、视角单一的简单场景,难以反映真实世界中的复杂情况。UFPR-VCR通过引入夜间、部分遮挡、不同视角等复杂场景,填补了这一空白,推动了车辆颜色识别领域的研究进展。该数据集为研究人员提供了一个更具挑战性的基准,帮助识别现有模型的局限性,并推动新方法的开发。
衍生相关工作
UFPR-VCR数据集的发布推动了车辆颜色识别领域的多项经典工作。基于该数据集,研究人员提出了多种改进的深度学习模型,如结合多尺度特征融合的卷积神经网络(CNN)和视觉Transformer(ViT)的混合模型。这些模型在复杂场景下的表现得到了显著提升,尤其是在夜间和部分遮挡条件下的识别准确率。此外,该数据集还激发了针对车辆颜色识别在不利条件下的预处理方法和数据增强技术的研究,进一步推动了该领域的技术进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录