five

shortery/dm-codes

收藏
Hugging Face2024-05-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shortery/dm-codes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含Data Matrix (DM)代码的照片及其注释。照片由iPhone拍摄并由人工手动注释。注释包括DM代码中编码的文本以及DM代码顶点的像素坐标。数据集还包含一个属性`is_clean`,用于指定图像中的DM代码是否易于读取。此外,README文件还提供了如何使用Python代码从图像中裁剪DM代码的示例,并提到了该数据集是某篇学位论文的一部分,用于比较各种编码器-解码器CNN以增强DM代码图像质量。

该数据集包含Data Matrix (DM)代码的照片及其注释。照片由iPhone拍摄并由人工手动注释。注释包括DM代码中编码的文本以及DM代码顶点的像素坐标。数据集还包含一个属性`is_clean`,用于指定图像中的DM代码是否易于读取。此外,README文件还提供了如何使用Python代码从图像中裁剪DM代码的示例,并提到了该数据集是某篇学位论文的一部分,用于比较各种编码器-解码器CNN以增强DM代码图像质量。
提供机构:
shortery
原始信息汇总

数据集概述

数据集特征

  • image: 图像数据
  • tl: 顶点坐标,序列类型为 int64
  • tr: 顶点坐标,序列类型为 int64
  • br: 顶点坐标,序列类型为 int64
  • bl: 顶点坐标,序列类型为 int64
  • is_clean: 布尔类型,指示DM码是否清晰可读
  • split: 字符串类型,数据集分割信息
  • text: 字符串类型,DM码中的文本
  • image_name: 字符串类型,图像名称

数据集分割

  • validation: 101个样本,大小为64018244字节
  • test: 199个样本,大小为125460818字节

数据集大小

  • 下载大小: 189448472字节
  • 数据集大小: 189479062字节

配置

  • default:
    • validation: 路径为data/validation-*
    • test: 路径为data/test-*

许可

  • MIT

任务类别

  • 图像到文本
  • 对象检测

大小类别

  • n<1K
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与图像处理领域,高质量的数据集是推动算法进步的关键基石。shortery/dm-codes 数据集的构建过程体现了严谨的学术规范,其核心内容为通过iPhone设备拍摄的Data Matrix(DM)码图像,并由人工进行精细标注。每一张图像均附有DM码所编码的文本信息以及其四个顶点的像素坐标,具体包括左上(tl)、右上(tr)、右下(br)、左下(bl)。尤为重要的是,数据集为每个DM码实体精心配置了多张图像,其中仅有一张被标记为清晰可读(is_clean=true),其余则被标记为存在阅读挑战(is_clean=false),这种对比性设计为研究图像质量增强提供了结构性基础。
特点
该数据集在条码识别与图像复原研究中展现出鲜明的特色。其首要特征在于提供了真实场景下采集的DM码图像,涵盖了从清晰到存在各种干扰的连续谱系,这为训练模型区分与修复图像退化因素创造了条件。数据集的结构化标注不仅包含解码文本,更精确提供了DM码四边形的几何顶点坐标,使得研究可同时聚焦于文本识别与目标检测两个核心任务。此外,数据集规模精炼,专注于验证集与测试集的划分,确保了评估的专注性与可靠性,为相关算法的鲁棒性测试提供了标准化的基准。
使用方法
对于致力于图像到文本转换或目标检测的研究者而言,该数据集提供了明确的使用路径。用户可通过Hugging Face的`datasets`库直接加载数据集,并利用附带的`crop_dm_code`函数,基于标注的顶点坐标,通过投影变换将图像中的DM码区域裁剪并规整为统一尺寸的正方形图像,这一预处理步骤极大便利了后续的模型输入标准化。数据集主要服务于学术研究,特别是与作者学位论文中所述的、旨在提升DM码可解码性的编码器-解码器CNN模型进行对比实验。使用者可依据提供的引用格式,在相关工作中规范地引述该数据集及其关联论文。
背景与挑战
背景概述
在计算机视觉与信息编码领域,Data Matrix(DM)码作为一种高密度二维条码,广泛应用于物流、制造业和文档管理。由马萨里克大学信息学院的研究者Petra Krátká于2024年创建的shortery/dm-codes数据集,旨在解决DM码在复杂现实场景中的图像质量增强与解码问题。该数据集作为一项学位论文的核心组成部分,聚焦于通过编码器-解码器卷积神经网络重构DM码图像,以提升其可解码性,为图像到文本与目标检测任务提供了宝贵的实验资源。
当前挑战
该数据集致力于应对DM码在非理想成像条件下的识别挑战,如光照不均、遮挡或形变导致的解码失败。构建过程中,研究者面临数据采集与标注的复杂性:需手动拍摄并标注DM码的顶点坐标与编码文本,同时区分清晰与模糊样本以模拟真实环境。此外,确保数据多样性与代表性,涵盖不同损坏程度的图像,对模型泛化能力提出了更高要求。
常用场景
经典使用场景
在计算机视觉与图像处理领域,DM codes数据集为数据矩阵(Data Matrix)码的识别与重建研究提供了关键资源。该数据集的核心应用场景在于训练和评估深度学习模型,特别是编码器-解码器卷积神经网络(CNN),以提升在复杂真实场景下(如光照不均、部分遮挡或图像模糊)数据矩阵码的图像质量。通过提供带有精确顶点坐标和编码文本标注的iPhone拍摄图像,研究者能够系统性地探索图像增强技术,旨在优化数据矩阵码的可解码性,为自动识别系统提供鲁棒的预处理方案。
衍生相关工作
该数据集源自一项具体的学位论文研究,其本身即是‘DataMatrix Image Reconstruction to Enhance Decodability’这一经典工作的直接产物。这项研究系统比较了多种编码器-解码器CNN架构在数据矩阵码图像重建任务上的性能。以此为基石,该领域潜在的衍生工作包括:探索更高效的轻量级网络以适应移动端部署、研究针对特定退化类型(如运动模糊、透视畸变)的专用增强模型,以及将成功的重建范式迁移至其他类型的二维条码(如QR码)或一般性的文档图像矫正任务中,拓展了初始研究的边界。
数据集最近研究
最新研究方向
在计算机视觉与图像处理领域,DM codes数据集聚焦于提升复杂环境下Data Matrix码的识别鲁棒性。该数据集通过提供包含清晰与模糊样本的配对图像,为基于深度学习的图像重建方法提供了关键训练资源。前沿研究主要围绕编码器-解码器卷积神经网络架构展开,旨在对受损或低质量的Data Matrix码图像进行增强处理,以优化传统解码器的读取成功率。这一方向紧密关联工业自动化、物流追溯等场景中二维码实时识别的实际需求,其进展对提升移动设备在非理想光照与角度条件下的数据采集能力具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作