FoodLogoDet-1500

Name: FoodLogoDet-1500
Creator: 中国科学院计算技术研究所智能信息处理重点实验室
Published: 2021-08-10 20:47:04
License: 暂无描述

arXiv2021-08-10 更新2024-06-21 收录

下载链接：

https://github.com/hq03/FoodLogoDet-1500-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

FoodLogoDet-1500是由中国科学院计算技术研究所智能信息处理重点实验室创建的大型公开食品标志数据集，包含1,500个类别，约100,000张图像和145,400个手动标注的食品标志对象。该数据集通过广泛使用的购物应用Taobao和Jingdong以及Wikipedia构建食品标志类别列表，从多个搜索引擎收集食品标志图像，并通过人工检查确保图像包含相应的食品标志。FoodLogoDet-1500旨在支持食品标志检测研究，解决食品标志类别大规模和相似性问题，适用于健康饮食推荐、食品商标侵权检测等多种应用场景。

FoodLogoDet-1500 is a large-scale public food logo dataset created by the Key Laboratory of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Sciences. It encompasses 1,500 categories, approximately 100,000 images, and 145,400 manually annotated food logo objects. The dataset constructs the food logo category list using the widely adopted shopping applications Taobao, Jingdong and Wikipedia, collects food logo images from multiple search engines, and verifies that the collected images contain the corresponding food logos via manual inspection. FoodLogoDet-1500 is intended to support food logo detection research, addressing the challenges of large-scale category counts and high inter-class similarity among food logo classes, and is applicable to multiple application scenarios such as healthy diet recommendation and food trademark infringement detection.

提供机构：

中国科学院计算技术研究所智能信息处理重点实验室

创建时间：

2021-08-10

搜集汇总

数据集介绍

构建方式

在食品标志检测领域，构建高质量数据集对于推动算法发展至关重要。FoodLogoDet-1500的构建过程分为三个关键步骤：首先，通过淘宝、京东等电商平台及维基百科广泛收集食品标志类别，确保类别覆盖的全面性；其次，利用搜索引擎如Google、Bing和百度，结合场景词汇进行图像爬取，以增强数据集的多样性和复杂性；最后，通过人工审核与标注，剔除重复及不完整图像，并对每个食品标志对象进行精细边界框标注，同时保留低分辨率及部分遮挡样本以提升检测挑战性。

特点

该数据集在规模与多样性方面表现突出，共包含1500个食品标志类别、约10万张图像及14.5万个标注对象，是目前公开规模最大的食品标志检测数据集。其特点体现在类别分布的不均衡性，以及标志对象的多尺度与高相似性，例如不同品牌的食品标志在视觉上极为接近，且数据集中小尺寸对象占比显著，这些特性为检测算法带来了分类与定位的双重挑战。

使用方法

FoodLogoDet-1500适用于训练与评估食品标志检测模型，尤其在处理大规模类别与相似标志的识别任务中具有重要价值。数据集已按类别随机划分为80%训练集与20%测试集，研究者可基于此基准开展算法实验。同时，该数据集支持多尺度特征解耦网络等先进方法的验证，通过平衡特征金字塔与特征偏移模块的设计，能够有效提升对复杂食品标志的检测精度。

背景与挑战

背景概述

食品标志检测作为多媒体领域的重要研究方向，在自助商店食品推荐与电商平台侵权检测等现实场景中具有广泛应用价值。2021年，由山东师范大学与中国科学院计算技术研究所联合团队发布的FoodLogoDet-1500数据集，标志着食品标志检测领域迈入大规模数据驱动的新阶段。该数据集涵盖1500个食品标志类别、近10万张图像及14.5万个精细标注对象，首次构建了公开可用的高质量食品标志检测基准。其核心研究目标在于解决传统标志数据集食品类别稀缺、标注规模有限的问题，通过融合多源搜索引擎数据与人工验证机制，为深度学习模型在复杂场景下的食品标志识别与品牌分析提供了关键数据支撑，显著推动了食品计算与智能商业分析领域的交叉发展。

当前挑战

FoodLogoDet-1500面临的挑战主要体现在领域问题与构建过程两个维度。在领域问题层面，食品标志检测需应对大规模细粒度分类的挑战，例如不同品牌的相似标志（如‘Chips Ahoy’与‘Chips More’）在视觉特征上高度接近，导致模型区分困难；同时，数据集中约56%的小尺度标志对象与多尺度分布特性，对检测算法的特征提取与定位精度提出了更高要求。在构建过程中，研究团队需克服食品标志类别体系构建的复杂性，通过融合电商平台与百科知识库确保类别覆盖的完整性；此外，数据采集阶段需平衡多源搜索引擎的多样性，并应对低分辨率、遮挡及非标准视角图像的标注难题，通过人工复核与众包验证保障标注质量，最终形成具有现实复杂性的高质量数据集。

常用场景

经典使用场景

在食品多媒体分析领域，FoodLogoDet-1500数据集为大规模食品商标检测提供了核心基准。其经典应用场景聚焦于训练和评估先进的深度学习模型，以应对现实世界中食品商标的多尺度、高相似性及遮挡等复杂挑战。研究者通常利用该数据集验证目标检测算法的鲁棒性，特别是在处理类别规模庞大（1500类）且类间差异微妙的食品商标图像时，数据集成为衡量模型分类与定位精度的关键试金石。

衍生相关工作

围绕FoodLogoDet-1500数据集，衍生出了一系列聚焦于改进食品商标检测性能的经典研究工作。其配套提出的多尺度特征解耦网络（MFDNet）成为该领域的代表性方法，它通过特征偏移模块和平衡特征金字塔，专门应对大规模类别和相似商标的挑战。此工作进一步激发了针对解耦头设计、小目标检测以及针对食品商标特性的特征表示学习等方向的研究。同时，该数据集也常被用作评估通用目标检测器（如Faster R-CNN、RetinaNet、YOLO系列等）在特定垂直领域适应性的基准，推动了领域自适应检测算法的发展。

数据集最近研究