DSBI

Name: DSBI
Creator: 中国科学院计算技术研究所
Published: 2019-04-02 10:43:53
License: 暂无描述

arXiv2019-04-02 更新2024-06-21 收录

下载链接：

https://github.com/yeluo1994/DSBI

下载链接

链接失效反馈

官方服务：

资源简介：

DSBI数据集由中国科学院计算技术研究所创建，包含114张双面盲文图像，来自6本不同的盲文书和一些普通印刷文档，旨在提供多样性和复杂性。数据集通过普通平板扫描仪获取，使用200dpi分辨率捕捉彩色盲文图像，并存储为JPEG格式。创建过程中，采用了辅助标注策略，通过自动检测盲文点和便捷的人机交互方法修改标注结果，显著提高了标注效率。DSBI数据集主要应用于盲文点检测，为盲文图像识别提供核心和基础步骤，旨在推动相关研究和评估算法性能。

The DSBI dataset was developed by the Institute of Computing Technology, Chinese Academy of Sciences. It contains 114 double-sided braille images collected from 6 different braille books and some common printed documents, designed to offer sufficient diversity and complexity. The dataset was acquired using a conventional flatbed scanner, with color braille images captured at 200 dpi resolution and stored in JPEG format. During the dataset construction, an auxiliary annotation strategy was employed, which automatically detects braille dots and revises annotation results through a user-friendly human-computer interaction approach, greatly enhancing annotation efficiency. The DSBI dataset is mainly utilized for braille dot detection, a core and fundamental step in braille image recognition, with the goal of facilitating relevant research and algorithm performance evaluation.

提供机构：

中国科学院计算技术研究所

创建时间：

2018-11-27

搜集汇总

数据集介绍

构建方式

DSBI数据集的构建方法主要涉及双面盲文图像的获取和标注。研究者们选择了平板扫描仪来获取双面盲文图像，以保证图像质量和降低采集噪声。同时，为了提高标注效率，提出了一种辅助标注策略，该策略首先利用Haar+Adaboost算法自动检测盲文点，然后通过人机交互方式对标注结果进行修改。这种标注策略能够将单张盲文图像正面点的标注效率平均提高六倍。

使用方法

DSBI数据集的使用方法主要包括以下步骤：首先，用户可以从GitHub网站下载数据集。其次，用户可以使用数据集中的训练集和测试集来调试分割方法的参数，并为基于机器学习的盲文点检测方法提供训练样本。最后，用户可以基于数据集中的标注信息，利用图像分割或Haar+Adaboost等方法进行盲文点检测实验，并通过计算精确度、召回率和F1值等指标来评估盲文点检测方法的性能。

背景与挑战

背景概述

盲文是一种帮助视障人士学习知识、获取信息和交流的有效方式。盲文图像识别旨在自动检测整个盲文图像中的盲文点，并识别盲文单元。然而，目前尚无可用于盲文图像识别的公开数据集，以推动相关研究并评估算法。本文构建了一个大规模的双面盲文图像数据集DSBI，其中包含详细的正面盲文点、背面盲文点和盲文单元标注信息。为了快速标注盲文图像，本文提出了一种辅助标注策略，该策略采用初始自动检测盲文点，并通过方便的人机交互方法修改标注结果。这种标注策略可以将单个盲文图像中正面盲文点的标注效率平均提高六倍。盲文点检测是盲文图像识别的核心和基础步骤。本文还在我们的数据集DSBI上评估了一些盲文点检测方法，并给出了正面盲文点检测的基准性能。我们已经在GitHub上发布了我们的盲文图像数据集。

当前挑战

1) 盲文图像识别领域的问题：盲文图像识别旨在自动检测整个盲文图像中的盲文点，并识别盲文单元。然而，盲文图像的复杂性、噪声和遮挡等因素给盲文点检测带来了挑战。2) 构建数据集过程中遇到的挑战：双面盲文图像中正面盲文点和背面盲文点混合在一起，难以实现高精度盲文图像识别结果。此外，数据集中存在一些缺陷，如油渍、纸张变形、裂纹和磨损的盲文点，这些缺陷在实际应用中非常常见，可以更全面地评估不同方法的性能。为了解决这些问题，本文提出了一种辅助标注策略，并构建了DSBI数据集，为盲文图像识别研究提供了重要的基准。

常用场景

经典使用场景

DSBI数据集主要用于盲文图像识别的研究和评估。其最经典的使用场景包括盲文点检测、盲文单元识别以及盲文图像分割。通过对DSBI数据集的深度学习和图像处理技术，可以自动识别盲文图像中的盲文点，进而识别出盲文单元，最终实现对盲文图像的完整识别。

解决学术问题

DSBI数据集解决了盲文图像识别领域的一个关键问题：缺乏公开的大规模双面盲文图像数据集。DSBI数据集包含详细的盲文正面点、反面点以及盲文单元的标注信息，为盲文图像识别研究提供了宝贵的资源。此外，DSBI数据集还提出了辅助标注策略，通过初始的盲文点自动检测和方便的人机交互方法修改标注结果，极大地提高了标注效率。

实际应用

DSBI数据集在实际应用中具有广泛的前景。例如，通过DSBI数据集训练的盲文图像识别模型可以应用于开发盲文阅读器、盲文打印机、盲文翻译软件等辅助设备，帮助视障人士更好地获取信息和进行交流。此外，DSBI数据集还可以用于评估和改进盲文图像识别算法的性能，推动盲文图像识别技术的不断发展。

数据集最近研究