SCUT-WMN DataSet

github2023-11-18 更新2024-05-31 收录

下载链接：

https://github.com/HCIILAB/Water-Meter-Number-DataSet

下载链接

链接失效反馈

官方服务：

资源简介：

SCUT-WMN数据集由华南理工大学深度学习和视觉计算实验室发布，用于水表数字识别研究。数据集包含两部分：第一部分包含5000个噪声样本，第二部分包含1000个干净样本，所有样本均标有序列字符。数据集中的字符数量在表1中展示，存在一些中间状态字符，这些字符被视为单独的类别，标签范围从10到19。数据集仅限于非商业研究用途。

The SCUT-WMN dataset, released by the Deep Learning and Visual Computing Laboratory at South China University of Technology, is designed for research on water meter digit recognition. The dataset comprises two parts: the first part includes 5000 noisy samples, and the second part contains 1000 clean samples, all of which are labeled with sequential characters. The number of characters in the dataset is presented in Table 1, which includes some intermediate state characters treated as separate categories, with labels ranging from 10 to 19. The dataset is restricted to non-commercial research purposes.

创建时间：

2018-09-17

原始信息汇总

数据集概述

数据集名称

Water-Meter-Number-DataSet

发布机构

Deep Leaning and Visual Computing Lab of South China University of Technology

使用限制

仅限于非商业研究目的

数据集内容

包含两部分：
- 第一部分：5000个噪声样本
  - 特征：受光照、折射、遮挡等因素影响，存在广泛变化
- 第二部分：1000个清洁样本
  - 特征：样本清晰，无明显干扰
所有样本均标注有顺序字符，如“1; 2; 2; 5; 8”

特殊标注处理

针对“中间状态”字符的处理：
- 将“中间状态”字符视为独立类别，标签范围为10至19
- 例如，标签“l = 19”表示字符处于‘9’和‘0’之间的“中间状态”
- 特殊处理规则：
  - 若预测数字位于序列末尾且处于“中间状态”，则减去9.5
  - 若“中间状态”字符非序列末尾，则减去10，选择“较低状态”

下载链接

SCUT-WMN DataSet下载链接

引用信息

论文标题：Fully Convolutional Sequence Recognition Network for Water Meter Number Reading
作者：F. Yang, L. Jin, S. Lai, X. Gao, Z. Li
发表年份：2019
期刊：IEEE Access

联系方式

邮箱：yfjiaren@foxmail.com, eelwjin@scut.edu.cn

搜集汇总

数据集介绍

构建方式

SCUT-WMN数据集由华南理工大学深度学习与视觉计算实验室构建，专为水表数字识别研究设计。该数据集包含两部分：5000个噪声样本和1000个干净样本。噪声样本涵盖了光照、折射、遮挡等多种干扰因素，而干净样本则提供了清晰的数字图像。所有样本均标注了连续的字符序列，如“1; 2; 2; 5; 8”。此外，数据集还特别处理了水表数字中的“中间状态”字符，将其作为独立类别进行标注，标签范围从‘10’到‘19’。

特点

SCUT-WMN数据集的显著特点在于其对水表数字识别中的“中间状态”字符进行了精细处理。这些字符表示数字介于两个整数之间的状态，例如“20369.5”。数据集通过将“中间状态”字符单独分类，并赋予其特定的标签，使得模型能够更准确地识别和预测这些特殊状态。此外，数据集中包含的噪声样本和干净样本为模型训练提供了丰富的多样性，有助于提升模型的鲁棒性和泛化能力。

使用方法

使用SCUT-WMN数据集时，研究人员可以通过下载链接获取数据集，并按照非商业研究目的进行使用。数据集中的样本已标注了字符序列，用户可以直接用于训练和测试水表数字识别模型。对于“中间状态”字符，用户需根据标签规则进行处理，例如将标签‘16’解释为数字‘6’的中间状态。此外，数据集提供了详细的示例和公式，帮助用户理解如何将预测结果转换为实际的水表读数。在使用过程中，建议引用相关论文以支持数据集的研究背景。

背景与挑战

背景概述

SCUT-WMN数据集由华南理工大学深度学习与视觉计算实验室发布，旨在推动水表数字识别领域的研究。该数据集于2019年首次公开，主要研究人员包括杨飞、金连文等。数据集的核心研究问题在于解决水表数字识别中的复杂场景挑战，如光照变化、折射、遮挡等干扰因素。通过提供包含噪声样本和干净样本的多样化数据，SCUT-WMN为水表数字识别算法的开发与评估提供了重要支持，推动了相关领域的技术进步。

当前挑战

SCUT-WMN数据集在解决水表数字识别问题时面临多重挑战。首先，水表数字识别需处理复杂的现实场景，如光照不均、折射效应和部分遮挡，这些因素导致数字形态多样且难以准确识别。其次，数据集中引入了‘中间状态’字符的概念，这些字符介于两个数字之间，增加了标签处理的复杂性。在构建数据集过程中，研究人员需精确标注这些中间状态字符，并设计合理的标签体系以支持后续算法开发。此外，数据集的噪声样本与干净样本的平衡性也对模型的鲁棒性提出了更高要求。

常用场景

经典使用场景

SCUT-WMN数据集在水表数字识别领域具有广泛的应用，尤其是在处理复杂环境下的数字识别任务中。该数据集包含了5000个带有噪声的样本和1000个干净的样本，涵盖了光照、折射、遮挡等多种干扰因素，为研究者提供了一个全面的实验平台。通过该数据集，研究者可以训练和测试各种深度学习模型，以提升水表数字识别的准确性和鲁棒性。

解决学术问题

SCUT-WMN数据集解决了水表数字识别中的多个关键学术问题，尤其是在处理“中间状态”字符时的挑战。通过引入“中间状态”标签（10到19），数据集有效地模拟了水表数字在过渡状态下的表现，使得模型能够更精确地识别和预测这些特殊状态。这一创新不仅提高了识别的准确性，还为相关领域的研究提供了新的思路和方法。

衍生相关工作

SCUT-WMN数据集的发布催生了一系列相关研究工作，尤其是在水表数字识别和序列识别领域。基于该数据集，研究者提出了多种创新的深度学习模型，如全卷积序列识别网络（FCSRN），这些模型不仅在识别精度上取得了显著提升，还为其他类似任务提供了参考。此外，该数据集还被用于研究噪声处理和字符分割等基础问题，推动了相关技术的进一步发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集