FoodX-251

Name: FoodX-251
Creator: SRI国际
Published: 2019-07-14 13:01:31
License: 暂无描述

arXiv2019-07-14 更新2024-06-21 收录

下载链接：

https://github.com/karansikka1/iFood 2019

下载链接

链接失效反馈

官方服务：

资源简介：

FoodX-251数据集由SRI国际创建，包含251个细粒度食品类别，总计158k张图像，主要从网络收集。数据集分为118k训练图像、12k验证图像和28k测试图像，所有图像均有人工验证的标签。数据集创建过程中，首先从Food-101数据集的101个食品类别中提取并筛选出251个类别，然后通过网络图像搜索下载相应图像，并进行去重和人工验证。该数据集主要应用于食品分类，旨在解决食品识别中的细粒度分类问题，为计算机视觉研究提供了一个独特的数据集。

The FoodX-251 dataset, created by SRI International, consists of 251 fine-grained food categories with a total of 158,000 images primarily collected from the web. The dataset is split into 118k training images, 12k validation images, and 28k test images, and all images have manually verified labels. During the dataset creation process, 251 categories were first extracted and screened from the 101 food categories of the Food-101 dataset, then corresponding images were downloaded via web image searches, followed by deduplication and manual verification. This dataset is mainly used for food classification tasks, aiming to solve the fine-grained classification problem in food recognition, providing a unique benchmark dataset for computer vision research.

提供机构：

SRI国际

创建时间：

2019-07-14

搜集汇总

数据集介绍

构建方式

在细粒度食品分类领域，构建高质量数据集面临类别繁多、视觉相似度高以及标注成本高昂的挑战。FoodX-251数据集的构建始于Food-101的101个类别，通过WordNet扩展获取同源类别，经人工筛选移除非食品或模糊类别，最终确定251个细粒度食品类别。针对每个类别，利用网络图像搜索引擎采集图像，此过程引入了跨域噪声（如加工食品包装图像）和跨类别噪声（如图像包含多种食品但仅标注单一类别）。为提升数据质量，研究团队剔除了重复图像，并从每类随机选取200张图像，由人工标注者进行三重验证，确保验证集与测试集免受噪声干扰。最终，数据集包含158,846张图像，其中118,000张用于训练，40,000张经人工标注后划分为验证集和测试集。

特点

FoodX-251数据集在食品视觉识别领域展现出显著特点。其涵盖251个细粒度食品类别，超越多数现有数据集在类别数量上的限制，且类别具有高度视觉相似性，如不同种类的蛋糕、三明治或意面，这加剧了分类任务的挑战性。数据集的图像规模达158,846张，提供了充足的训练样本，支持深度学习模型的充分训练。此外，数据集包含多样化的食品类型，不局限于特定菜系，增强了其通用性和应用广度。人工验证的40,000张图像确保了验证集和测试集的标注准确性，为模型评估提供了可靠基准。数据分布呈现不均衡性，热门食品如“油条”或“肉丸”样本丰富，而“大理石蛋糕”等类别样本较少，反映了真实世界中的食品流行度差异。

使用方法

FoodX-251数据集适用于细粒度食品分类任务的研究与评估。在使用时，研究人员可将118,000张训练图像用于模型训练，利用12,000张验证集进行超参数调优和早期停止，以避免过拟合。测试集包含28,000张图像，用于最终模型性能的客观评估，评估指标采用top-3错误率，即允许模型输出三个预测标签，若其中任一与真实标签匹配则视为正确。为提升模型性能，建议采用数据增强技术如随机水平翻转和裁剪，以增加训练样本的多样性。基于该数据集的基线实验表明，使用预训练的ResNet-101模型并微调全部层数，可显著降低错误率。数据集还可用于组织或参与计算机视觉挑战赛，如iFood-2019竞赛，推动食品识别算法的进步。

背景与挑战

背景概述

随着智能手机的普及，自动监测饮食摄入与营养评估成为健康管理领域的重要研究方向。FoodX-251数据集于2019年由SRI国际、谷歌及康奈尔科技等机构的研究团队联合构建，旨在解决细粒度食品分类中的核心难题。该数据集涵盖251个精细食品类别，包含约15.8万张网络图像，超越了同期数据集的规模与多样性。其创建推动了计算机视觉在食品识别领域的应用，为自动化饮食日志系统提供了关键数据支持，并在CVPR 2019的细粒度视觉分类研讨会上作为iFood挑战赛基准，显著促进了相关算法的发展。

当前挑战

在细粒度食品分类领域，主要挑战在于类别间视觉相似度高而类内差异大，例如不同面食或甜点的区分极为困难。构建FoodX-251数据集时，研究团队面临网络数据固有的噪声问题：跨域噪声如包装食品或原料图像混入目标类别，以及跨类别噪声即单标签图像中包含多种食品。此外，数据清洗需人工验证以消除噪声，但部分类别样本分布不均，如‘牛排鞑靼’等冷门食品图像稀缺，影响了模型的均衡学习能力。

常用场景

经典使用场景

在计算机视觉领域，细粒度图像分类任务因其类别间视觉差异微小而极具挑战性。FoodX-251数据集凭借其涵盖251个精细食物类别、包含15.8万张图像的规模，成为该领域经典基准。研究者常利用此数据集训练深度神经网络，如ResNet等模型，通过微调策略优化分类性能，推动算法在复杂食物识别场景中的准确率提升。该数据集在CVPR 2019的FGVC6研讨会上举办的iFood-2019挑战赛中，被广泛用于评估模型在跨类别噪声和跨域噪声环境下的鲁棒性。

解决学术问题

FoodX-251数据集有效应对了食物图像分类研究中数据稀缺与质量不足的难题。其通过网页爬取结合人工验证的方式，构建了大规模、多类别的标注数据，缓解了传统数据收集方法成本高昂、可扩展性差的问题。该数据集支持研究者探索细粒度分类中的类内高变异与类间低差异现象，如不同种类蛋糕或面食的视觉区分。同时，它促进了噪声鲁棒性学习、跨域适应及弱监督学习等前沿方向的发展，为自动化饮食监测系统的算法优化提供了关键数据基础。

衍生相关工作

围绕FoodX-251数据集，学术界衍生出多项经典研究工作。例如，在iFood-2019挑战赛中，参赛团队提出了多种深度网络架构与数据增强策略，以提升细粒度食物分类的精度。后续研究进一步探索了多模态学习，结合食谱文本或营养成分信息增强模型判别能力。此外，针对数据集中存在的跨域与跨类别噪声，学者们发展了弱监督与半监督学习方法，以降低对纯净标注数据的依赖。这些工作不仅推动了食物识别领域的进展，也为通用细粒度视觉分类任务提供了可迁移的技术见解。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集