five

VOC-360 和 Wider-360|计算机视觉数据集|鱼眼图像处理数据集

收藏
arXiv2019-06-28 更新2024-07-18 收录
计算机视觉
鱼眼图像处理
下载链接:
VOC-360: http://dx.doi.org/10.25314/ca0092b1-1e87-4928-b5f5ebae30decb8d, Wider-360: https://researchdata.sfu.ca/pydio_public/c09804
下载链接
链接失效反馈
资源简介:
VOC-360和Wider-360是西蒙弗雷泽大学工程科学学院创建的两个新型鱼眼图像数据集,用于训练面部和物体检测模型。VOC-360包含39,575张用于物体检测、分割和分类的鱼眼图像,而Wider-360包含63,897张用于面部检测的鱼眼图像。这些数据集通过将VOC2012和Wider Face数据集中的常规图像转换为鱼眼图像而创建,适用于开发鱼眼图像的面部和物体检测器及分割模块。数据集的应用领域包括计算机视觉和模式识别,旨在解决鱼眼图像中的物体检测和面部识别问题。
提供机构:
西蒙弗雷泽大学工程科学学院
创建时间:
2019-06-28
AI搜集汇总
数据集介绍
main_image_url
构建方式
VOC-360和Wider-360数据集通过后处理来自VOC2012和Wider Face两个知名数据集的常规图像构建而成。这些常规图像首先被转换为鱼眼图像,转换过程基于Matlab实现的从常规图像到鱼眼图像的映射模型。具体而言,原始图像中的方形区域被采样并转换为圆形区域,随后通过进一步的挤压处理生成鱼眼效果。此外,所有相关的标注信息,包括对象检测、分类和分割的标注,均被转换为适应鱼眼图像坐标系的新格式。
使用方法
VOC-360数据集适用于训练机器学习模型进行对象检测、分类和分割,其图像和标注文件分别存储在不同的目录中,便于访问和处理。Wider-360数据集则适用于训练人脸检测模型,其图像根据场景类型组织,标注信息以MAT文件格式存储,便于提取和使用。用户可以通过提供的链接访问这些数据集,并根据需要进行训练、测试和验证。
背景与挑战
背景概述
VOC-360和Wider-360数据集由加拿大西蒙弗雷泽大学工程科学学院的Jianglin Fu、Ivan V. Bajić和Rodney G. Vaughan于2019年创建,旨在为鱼眼图像中的人脸和物体检测提供训练数据。这两个数据集通过后处理来自VOC2012和Wider Face的常规图像,利用Matlab实现的模型将其转换为鱼眼图像,并相应调整标注。VOC-360包含39,575张鱼眼图像,适用于物体检测、分割和分类;Wider-360则包含63,897张鱼眼图像,专为面部检测设计。这些数据集的推出填补了鱼眼图像领域在深度学习应用中的空白,为研究人员和工程师提供了宝贵的资源,尤其是在真实鱼眼图像采集和手动标注尚在进行中的背景下。
当前挑战
VOC-360和Wider-360数据集在构建过程中面临多项挑战。首先,鱼眼图像的非线性几何畸变使得从常规图像到鱼眼图像的转换变得复杂,需要精确的坐标映射和标注调整。其次,鱼眼图像的特殊视角和畸变特性对物体和人脸检测算法提出了更高的要求,现有的检测模型在鱼眼图像上的性能可能显著下降。此外,数据集的标注工作也面临挑战,尤其是如何准确地将常规图像的标注转换为鱼眼图像的标注,确保标注的精度和一致性。这些挑战不仅影响了数据集的构建效率,也对后续的模型训练和评估提出了更高的技术要求。
常用场景
经典使用场景
VOC-360和Wider-360数据集的经典使用场景主要集中在鱼眼图像中的人脸和物体检测任务。VOC-360数据集适用于训练物体检测、分类和分割模型,而Wider-360数据集则专注于人脸检测。这两个数据集通过提供经过处理的鱼眼图像及其相应的标注,为研究人员和工程师提供了在鱼眼图像上直接训练深度学习模型的宝贵资源。
解决学术问题
VOC-360和Wider-360数据集解决了鱼眼图像中物体和人脸检测的学术研究难题。由于鱼眼图像的特殊几何畸变,传统的检测算法在鱼眼图像上表现不佳。这两个数据集通过提供大量的鱼眼图像及其标注,使得研究人员能够开发和验证专门针对鱼眼图像的检测算法,从而推动了鱼眼图像处理领域的发展。
实际应用
在实际应用中,VOC-360和Wider-360数据集广泛应用于监控系统、自动驾驶和增强现实等领域。例如,在监控系统中,鱼眼摄像头可以提供更广阔的视野,而这两个数据集可以帮助开发更精确的物体和人脸检测算法,从而提高监控系统的效率和准确性。此外,在自动驾驶中,鱼眼摄像头可以捕捉到车辆周围的全景信息,而这两个数据集则为开发适应鱼眼图像的感知算法提供了重要支持。
数据集最近研究
最新研究方向
在计算机视觉领域,VOC-360和Wider-360数据集的最新研究方向主要集中在鱼眼图像中的目标检测与分割技术。这两个数据集通过将常规图像转换为鱼眼图像,并提供相应的标注,为研究人员提供了宝贵的资源,以开发和训练针对鱼眼图像的深度学习模型。VOC-360数据集特别适用于物体检测、分类和分割任务,而Wider-360则专注于人脸检测,这两个数据集的推出填补了鱼眼图像处理领域的数据空白。随着自动驾驶、智能监控等应用场景对鱼眼图像处理需求的增加,这些数据集的研究不仅推动了相关算法的发展,也为实际应用提供了理论支持和技术储备。
相关研究论文
  • 1
    Datasets for Face and Object Detection in Fisheye Images西蒙弗雷泽大学工程科学学院 · 2019年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

UniMed

UniMed是一个大规模、开源的多模态医学数据集,包含超过530万张图像-文本对,涵盖六种不同的医学成像模态:X射线、CT、MRI、超声、病理学和眼底。该数据集通过利用大型语言模型(LLMs)将特定模态的分类数据集转换为图像-文本格式,并结合现有的医学领域的图像-文本数据,以促进可扩展的视觉语言模型(VLM)预训练。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

glaive-function-calling-openai

该数据集包含用于训练和评估语言模型在函数调用能力上的对话示例。数据集包括一个完整的函数调用示例集合和一个精选的子集,专注于最常用的函数。数据集的结构包括一个完整的数据集和几个测试子集。每个记录都是一个JSON对象,包含对话消息、可用函数定义和实际的函数调用。数据集还包括最常用的函数分布信息,并提供了加载和评估数据集的示例代码。

huggingface 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录