five

The Street View House Numbers Dataset

收藏
github2019-08-20 更新2024-05-31 收录
下载链接:
https://github.com/arnav1598/SVHN_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
SVHN是一个用于开发机器学习和物体识别算法的真实世界图像数据集。它可以被视为类似于MNIST(例如,图像包含小裁剪的数字),但包含了多一个数量级的标记数据,并来自一个更难、未解决的实际问题(在自然场景图像中识别数字和数字)。SVHN是从Google街景图像中的房屋号码中获取的。

SVHN is a real-world image dataset designed for developing machine learning and object recognition algorithms. It can be considered analogous to MNIST (for instance, the images contain small cropped digits), but it includes an order of magnitude more labeled data and originates from a more challenging, unsolved real-world problem (recognizing digits and numbers in natural scene images). SVHN is derived from house numbers in Google Street View images.
创建时间:
2018-12-16
原始信息汇总

The Street View House Numbers Dataset (SVHN) 概述

数据集描述

  • 目的:SVHN是一个用于开发机器学习和目标识别算法的真实世界图像数据集。
  • 特点:与MNIST类似,但包含更多标记数据,且源自一个更具挑战性的现实问题,即在自然场景图像中识别数字和数字。
  • 来源:数据集来自Google Street View图像中的房屋号码。

数据集修改

  • 修改内容:原始SVHN数据集被修改以适配Keras,包含原始训练和测试图像,以及裁剪至边界框的训练和测试图像。
  • 附加文件:包含两个CSV文件,记录了训练和测试图像的边界框和标签信息。

模型结构

  • 组成部分
    1. 数据集预处理,以适应工作需求。
    2. 使用CNN进行边界框回归,确定包含图像中所有数字的边界框的顶部、左侧、底部和右侧。
    3. 利用步骤1中的边界框提取仅含数字的图像部分,并使用其他CNN进行数字分类。
    4. 在测试图像上应用模型并输出结果。

应用场景

  1. 高端应用:用于标记Google地图中的房屋/街道号码。
  2. 评估小学生数学答卷(边界框已预先指定)。
  3. 在数字平台上标记学生出勤情况。
搜集汇总
数据集介绍
main_image_url
构建方式
The Street View House Numbers (SVHN)数据集的构建,是通过从Google Street View中截取包含住宅门牌号码的自然场景图像而完成的。该数据集的构建采取了 bounding box 回归与数字分类的两阶段卷积神经网络(CNN)模型训练方法,首先通过一个CNN预测图像中所有数字的边界框坐标,进而将图像中包含数字的区域进行裁剪。其次,再使用另一个CNN对这些裁剪后的区域进行数字分类,以此实现对图像中数字的精确识别。
特点
SVHN数据集的特点在于其图像来源的真实世界场景,这为机器学习与目标识别算法的发展提出了挑战。其包含的图像具有多变的照明条件、遮挡以及丰富的背景多样性,这些特点使得该数据集相较于MNIST等简单数据集而言,更具现实复杂性和应用价值。此外,数据集经过特定的预处理,如裁剪至边界框并组织标签至CSV文件,以便于与Keras框架的无缝集成。
使用方法
使用SVHN数据集时,用户需先将数据集进行适当的预处理,包括图像的裁剪和标签的整理。随后,可以利用该数据集训练CNN模型,进行数字的定位与识别。在模型训练完毕后,可以应用于街道地址识别、教育工具中的自动评分系统,以及考勤系统中的自动签到等实际场景中,以提升相关系统的效率和准确性。
背景与挑战
背景概述
The Street View House Numbers (SVHN)数据集,诞生于机器学习和对象识别算法研究领域,旨在为算法开发提供一个真实世界的挑战。该数据集由Google Street View中的自然场景图像构成,其研究背景可追溯至对MNIST等简单数据集的超越,以应对更为复杂的数字识别任务。自创建以来,该数据集便由相关领域的研究人员所关注,他们致力于通过深度学习技术,尤其是卷积神经网络(CNN),来精确识别和定位图像中的数字。SVHN数据集的出现,对图像识别领域产生了显著影响,推动了相关技术的发展。
当前挑战
SVHN数据集面临的挑战主要在于其图像来源的多样性,这导致了光照变化、遮挡以及复杂背景等问题,增加了数字识别的难度。具体而言,研究人员在构建模型时,需克服以下挑战:1) 如何准确地进行边界框回归,以确定包含数字的图像区域;2) 如何在边界框确定后,对框内的数字进行精确分类。此外,数据集的处理和预处理,如图像剪裁、标签组织等,也对模型的兼容性和效率提出了考验。这些挑战的存在,使得SVHN数据集成为了评估和提升数字识别算法鲁棒性的重要资源。
常用场景
经典使用场景
在深入探索机器学习与对象识别算法的领域,The Street View House Numbers (SVHN) 数据集以其源自真实世界场景的图像,为研究者提供了一个识别数字的挑战性任务。该数据集的经典使用场景在于,研究者通过构建卷积神经网络(CNN)模型,首先进行边界框回归以定位图像中的数字,随后对截取的数字区域进行分类识别,从而实现复杂背景下的数字识别任务。
衍生相关工作
基于SVHN 数据集的研究,衍生了众多经典工作。这些工作涉及改进数字定位与识别的算法,如深度学习模型的创新设计、模型压缩与加速技术,以及跨领域应用的研究,如从图像识别到自然语言处理的迁移学习。
数据集最近研究
最新研究方向
在计算机视觉与数字识别领域,The Street View House Numbers Dataset(SVHN)数据集的近期研究集中于提升算法在复杂自然环境下的鲁棒性。研究重点在于开发了一种两步骤的模型:第一步为边界框回归,利用卷积神经网络(CNN)预测包含图像中所有数字的边界框坐标;第二步为数字分类,对边界框内的图像区域进行数字识别。此类研究不仅提升了算法对光照变化、遮挡和复杂背景的处理能力,而且在街道地址识别、教育评估工具以及考勤系统中具有重要的现实应用价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作