five

dimun/ExpirationDate

收藏
Hugging Face2024-02-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dimun/ExpirationDate
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于产品包装上日期的目标检测任务,包含多个子数据集(Products-Real, Products-Synth, Date-Real, Date-Synth, Components-Real, Components-Synth)。每个子数据集中的日期数据都标注了类别、边界框坐标、日期转录、图像宽度和高度等信息。训练集中定义了四个类别:date、due、prod和code,而测试集中的过期日期则特别标注为“exp”类别以便于评估。此外,Date-Real和Date-Synth数据集中的日期组件(如日、月、年)也进行了标注。Components-Real和Components-Synth数据集则包含了日期组件及其转录信息。

该数据集主要用于产品包装上日期的目标检测任务,包含多个子数据集(Products-Real, Products-Synth, Date-Real, Date-Synth, Components-Real, Components-Synth)。每个子数据集中的日期数据都标注了类别、边界框坐标、日期转录、图像宽度和高度等信息。训练集中定义了四个类别:date、due、prod和code,而测试集中的过期日期则特别标注为“exp”类别以便于评估。此外,Date-Real和Date-Synth数据集中的日期组件(如日、月、年)也进行了标注。Components-Real和Components-Synth数据集则包含了日期组件及其转录信息。
提供机构:
dimun
原始信息汇总

数据集概述

数据集描述

  • 数据集名称: Products-Real, Products-Synth, Date-Real, Date-Synth, Components-Real, Components-Synth
  • 任务类别: 目标检测
  • 语言: 英语

标注信息

  • Products-Real 和 Products-Synth 数据集:

    • 标注内容: 类别、边界框坐标、日期转录、图像宽度和高度
    • 类别定义: date, due, prod, code(训练集);exp(测试集中的 Product-Real 数据集)
  • Date-Real 和 Date-Synth 数据集:

    • 标注内容: 类别、边界框、转录
    • 类别定义: day, month, year
  • Components-Real 和 Components-Synth 数据集:

    • 包含内容: 日、月、年的组件及其转录

引用

  • 原始出版物: A Generalized Framework for Recognition of Expiration Date on Product Packages Using Fully Convolutional Networks
  • 作者: Seker, Ahmet Cagatay 和 Ahn, Sang Chul
  • 期刊: Expert Systems with Applications
  • 页码: 117310
  • 年份: 2022
  • 出版社: Elsevier
搜集汇总
数据集介绍
main_image_url
构建方式
在商品包装识别领域,ExpirationDate数据集通过多源数据融合策略构建而成。该数据集整合了真实场景下的产品图像与合成生成的数据,分别形成Products-Real、Products-Synth、Date-Real、Date-Synth以及Components-Real和Components-Synth六个子集。标注过程采用精细的边界框与文本转录,针对日期、到期日、生产日期和代码等类别进行多层次标注,测试集特别引入“exp”类别以优化评估流程。这种构建方式确保了数据在真实性与多样性之间的平衡,为模型训练提供了扎实的基础。
特点
本数据集的核心特点体现在其层次化的标注体系与多模态数据构成。标注体系不仅包含整体日期区域的定位,还深入分解至日、月、年等时间组件,并辅以精确的文本转录信息,实现了从粗粒度到细粒度的全面覆盖。数据来源兼具真实拍摄图像与合成生成图像,有效模拟了光照、角度、遮挡等实际场景中的复杂变化。这种结构设计显著提升了数据集在应对商品包装日期识别任务时的鲁棒性与泛化能力,为相关研究提供了丰富的实验素材。
使用方法
使用该数据集时,研究者可依据子集特性灵活开展目标检测与文本识别任务。对于Products子集,可直接应用于端到端的过期日期检测与识别;Date与Components子集则更适合用于日期组件的结构化解析与转录研究。在模型训练阶段,建议结合真实与合成数据以增强模型泛化性能;评估时,可利用测试集中专门标注的“exp”类别进行针对性性能度量。该数据集支持对现有算法在复杂场景下的有效性进行系统验证,推动商品包装自动识别技术的进步。
背景与挑战
背景概述
在计算机视觉与模式识别领域,产品包装上的有效期识别是零售自动化与食品安全监控中的关键任务。由Ahmet Cagatay Seker与Sang Chul Ahn于2022年提出,并发表于《Expert Systems with Applications》期刊的ExpirationDate数据集,旨在构建一个通用框架,利用全卷积网络实现产品包装上有效期的精准检测与识别。该数据集由真实与合成图像组成,标注涵盖日期、到期日、生产日期及代码等多类别边界框与转录信息,推动了零售物流与智能库存管理系统的技术进步。
当前挑战
该数据集致力于解决产品包装有效期自动识别的复杂问题,其挑战在于日期格式的多样性与包装背景的干扰,如光照变化、文本扭曲及遮挡现象。构建过程中,研究人员需克服真实场景数据收集的局限性,通过合成数据增强样本多样性,并确保标注一致性以支持多类别检测任务,同时需平衡合成与真实数据的分布差异以提升模型泛化能力。
常用场景
经典使用场景
在计算机视觉与模式识别领域,ExpirationDate数据集为产品包装上的日期识别任务提供了标准化基准。该数据集通过标注日期、到期日、生产日期和代码等类别,支持目标检测模型的训练与评估,尤其在零售自动化与供应链管理中,对过期日期的高精度检测成为关键应用场景。其合成与真实图像结合的设计,有效模拟了复杂背景下的日期定位挑战,推动了视觉系统在现实环境中的鲁棒性提升。
实际应用
在实际应用中,ExpirationDate数据集直接服务于零售库存管理、食品安全监控与物流自动化系统。例如,超市或仓库可通过集成基于该数据集的视觉模型,自动扫描商品包装,实时检测过期日期,减少人工核查成本与错误率。此外,在制药或食品行业,该系统能提升合规性检查效率,确保产品流通安全,体现了人工智能在工业自动化中的落地价值。
衍生相关工作
围绕ExpirationDate数据集,衍生出多项经典研究工作,如Seker与Ahn提出的全卷积网络框架,该框架优化了日期检测的精度与速度。后续研究扩展至多语言日期识别、小样本学习场景,以及结合注意力机制的增强模型。这些工作不仅深化了日期识别技术的理论探索,还推动了相关数据集在更广泛文本检测任务中的迁移应用,形成了持续的学术演进脉络。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作