shortery/dm-codes

Name: shortery/dm-codes
Creator: shortery
Published: 2024-05-27 09:33:49
License: 暂无描述

Hugging Face2024-05-27 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/shortery/dm-codes

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含Data Matrix (DM)代码的照片及其注释。照片由iPhone拍摄并由人工手动注释。注释包括DM代码中编码的文本以及DM代码顶点的像素坐标。数据集还包含一个属性`is_clean`，用于指定图像中的DM代码是否易于读取。此外，README文件还提供了如何使用Python代码从图像中裁剪DM代码的示例，并提到了该数据集是某篇学位论文的一部分，用于比较各种编码器-解码器CNN以增强DM代码图像质量。

提供机构：

shortery

原始信息汇总

数据集概述

数据集特征

image: 图像数据
tl: 顶点坐标，序列类型为 int64
tr: 顶点坐标，序列类型为 int64
br: 顶点坐标，序列类型为 int64
bl: 顶点坐标，序列类型为 int64
is_clean: 布尔类型，指示DM码是否清晰可读
split: 字符串类型，数据集分割信息
text: 字符串类型，DM码中的文本
image_name: 字符串类型，图像名称

数据集分割

validation: 101个样本，大小为64018244字节
test: 199个样本，大小为125460818字节

数据集大小

下载大小: 189448472字节
数据集大小: 189479062字节

配置

default:
- validation: 路径为data/validation-*
- test: 路径为data/test-*

许可

任务类别

图像到文本
对象检测

大小类别

n<1K

搜集汇总

数据集介绍

构建方式

在计算机视觉与图像处理领域，高质量的数据集是推动算法进步的关键基石。shortery/dm-codes 数据集的构建过程体现了严谨的学术规范，其核心内容为通过iPhone设备拍摄的Data Matrix（DM）码图像，并由人工进行精细标注。每一张图像均附有DM码所编码的文本信息以及其四个顶点的像素坐标，具体包括左上（tl）、右上（tr）、右下（br）、左下（bl）。尤为重要的是，数据集为每个DM码实体精心配置了多张图像，其中仅有一张被标记为清晰可读（is_clean=true），其余则被标记为存在阅读挑战（is_clean=false），这种对比性设计为研究图像质量增强提供了结构性基础。

特点

该数据集在条码识别与图像复原研究中展现出鲜明的特色。其首要特征在于提供了真实场景下采集的DM码图像，涵盖了从清晰到存在各种干扰的连续谱系，这为训练模型区分与修复图像退化因素创造了条件。数据集的结构化标注不仅包含解码文本，更精确提供了DM码四边形的几何顶点坐标，使得研究可同时聚焦于文本识别与目标检测两个核心任务。此外，数据集规模精炼，专注于验证集与测试集的划分，确保了评估的专注性与可靠性，为相关算法的鲁棒性测试提供了标准化的基准。

使用方法

对于致力于图像到文本转换或目标检测的研究者而言，该数据集提供了明确的使用路径。用户可通过Hugging Face的`datasets`库直接加载数据集，并利用附带的`crop_dm_code`函数，基于标注的顶点坐标，通过投影变换将图像中的DM码区域裁剪并规整为统一尺寸的正方形图像，这一预处理步骤极大便利了后续的模型输入标准化。数据集主要服务于学术研究，特别是与作者学位论文中所述的、旨在提升DM码可解码性的编码器-解码器CNN模型进行对比实验。使用者可依据提供的引用格式，在相关工作中规范地引述该数据集及其关联论文。

背景与挑战

背景概述

在计算机视觉与信息编码领域，Data Matrix（DM）码作为一种高密度二维条码，广泛应用于物流、制造业和文档管理。由马萨里克大学信息学院的研究者Petra Krátká于2024年创建的shortery/dm-codes数据集，旨在解决DM码在复杂现实场景中的图像质量增强与解码问题。该数据集作为一项学位论文的核心组成部分，聚焦于通过编码器-解码器卷积神经网络重构DM码图像，以提升其可解码性，为图像到文本与目标检测任务提供了宝贵的实验资源。

当前挑战

该数据集致力于应对DM码在非理想成像条件下的识别挑战，如光照不均、遮挡或形变导致的解码失败。构建过程中，研究者面临数据采集与标注的复杂性：需手动拍摄并标注DM码的顶点坐标与编码文本，同时区分清晰与模糊样本以模拟真实环境。此外，确保数据多样性与代表性，涵盖不同损坏程度的图像，对模型泛化能力提出了更高要求。

常用场景

经典使用场景

在计算机视觉与图像处理领域，DM codes数据集为数据矩阵（Data Matrix）码的识别与重建研究提供了关键资源。该数据集的核心应用场景在于训练和评估深度学习模型，特别是编码器-解码器卷积神经网络（CNN），以提升在复杂真实场景下（如光照不均、部分遮挡或图像模糊）数据矩阵码的图像质量。通过提供带有精确顶点坐标和编码文本标注的iPhone拍摄图像，研究者能够系统性地探索图像增强技术，旨在优化数据矩阵码的可解码性，为自动识别系统提供鲁棒的预处理方案。

衍生相关工作

该数据集源自一项具体的学位论文研究，其本身即是‘DataMatrix Image Reconstruction to Enhance Decodability’这一经典工作的直接产物。这项研究系统比较了多种编码器-解码器CNN架构在数据矩阵码图像重建任务上的性能。以此为基石，该领域潜在的衍生工作包括：探索更高效的轻量级网络以适应移动端部署、研究针对特定退化类型（如运动模糊、透视畸变）的专用增强模型，以及将成功的重建范式迁移至其他类型的二维条码（如QR码）或一般性的文档图像矫正任务中，拓展了初始研究的边界。

数据集最近研究