nateraw/food101

Name: nateraw/food101
Creator: nateraw
Published: 2022-07-08 07:06:41
License: 暂无描述

Hugging Face2022-07-08 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/nateraw/food101

下载链接

链接失效反馈

官方服务：

资源简介：

Food-101数据集是一个用于图像分类任务的数据集，包含101种食物类别，共计101,000张图像。每个类别包含250张经过手动审核的测试图像和750张训练图像。训练图像未经过清洗，可能包含噪声，如图像颜色过于强烈或标签错误。所有图像的最大边长被调整为512像素。数据集的语言为英语，数据实例包含图像文件路径和分类标签两个字段。

The Food-101 dataset is a benchmark dataset for image classification tasks, containing 101 food categories with a total of 101,000 images. For each category, there are 250 manually reviewed test images and 750 training images. The training images have not been pre-cleaned and may contain noise, such as overly saturated colors or incorrect labels. All images are resized so that their maximum side length is 512 pixels. The dataset uses English as its language, and each data instance includes two fields: the image file path and the classification label.

提供机构：

nateraw

原始信息汇总

数据集概述

数据集基本信息

数据集名称: food101
语言: 英语
许可证: 未知
多语言性: 单语
大小: 10K<n<100K
源数据集: 扩展自其他-foodspotting
任务类别: 其他
任务ID: other-other-image-classification
论文代码链接ID: food-101

数据集描述

数据集总结

包含类别: 101个食品类别
图像数量: 共101,000张图像
图像处理: 所有图像最大边长调整为512像素
数据分割: 每个类别包含750张训练图像和250张手动审核的测试图像
数据质量: 训练图像未经过彻底清理，可能包含噪声，如强烈色彩和错误标签

支持的任务和排行榜

任务: 图像分类

语言

语言: 英语

数据集结构

数据实例

示例:

{ image: /path/to/image.jpg, label: 23 }
字段:
- image: 字符串类型，图像文件路径
- label: 整数类型，分类标签

数据分割

分割详情:

name train validation

food101 75750 25250

数据集创建

来源数据

源数据: 扩展自其他-foodspotting

注释

注释创建者: 众包

许可证信息

许可证: 未知

引用信息

引用格式:

@inproceedings{bossard14, title = {Food-101 -- Mining Discriminative Components with Random Forests}, author = {Bossard, Lukas and Guillaumin, Matthieu and Van Gool, Luc}, booktitle = {European Conference on Computer Vision}, year = {2014} }

贡献者

贡献者: @nateraw

搜集汇总

数据集介绍

构建方式

在计算机视觉与食品识别领域，Food-101数据集的构建体现了大规模图像分类任务的典型范式。该数据集源自Foodspotting平台，通过众包方式收集了101个食品类别的图像，每个类别包含1000张图片，总计101,000张样本。构建过程中，每个类别被划分为750张训练图像与250张测试图像，训练集特意保留了原始噪声，如色彩偏差与部分错误标签，以模拟真实场景的复杂性。所有图像均经过标准化处理，将最大边长缩放至512像素，确保了数据格式的统一性。

特点

Food-101数据集在食品图像识别领域具有显著的代表性。其核心特点在于涵盖101类常见食品，规模达到十万余张图像，为模型训练提供了丰富的视觉多样性。数据集刻意保留了训练集中的噪声元素，包括强烈色彩与少量标注误差，这增强了模型在真实应用中的鲁棒性。此外，每类食品均提供经过人工审核的测试集，确保了评估的可靠性，而统一的图像分辨率则优化了计算效率。

使用方法

该数据集主要应用于图像分类任务，用户可通过HuggingFace平台直接加载，利用其预划分的训练集与验证集进行模型训练与评估。典型流程包括读取图像路径与对应标签，构建分类器以识别食品类别。鉴于训练集包含噪声，建议采用数据增强或鲁棒性训练策略以提升模型性能。数据集的标准化格式便于集成至主流深度学习框架，为食品识别研究提供基准支持。

背景与挑战

背景概述

在计算机视觉与模式识别领域，食品图像识别作为细粒度视觉分类的重要分支，长期以来因类间相似性高、类内差异大而备受关注。Food-101数据集由瑞士苏黎世联邦理工学院计算机视觉实验室的Lukas Bossard、Matthieu Guillaumin和Luc Van Gool等研究人员于2014年构建，旨在为食品图像分类提供大规模基准数据。该数据集涵盖101类常见西式餐点，包含10.1万张图像，每类提供750张训练图像与250张经人工审核的测试图像，其规模与多样性推动了深度学习模型在细粒度分类任务中的演进，成为食品计算领域里程碑式资源。

当前挑战

Food-101数据集所针对的细粒度食品分类任务，面临类间视觉特征高度相似（如不同甜点变体）、光照与拍摄角度多变、背景干扰显著等核心挑战。在数据构建过程中，研究者刻意保留训练集中的标注噪声与色彩失真，以模拟真实场景的复杂性，这虽增强了数据集的现实代表性，却为模型鲁棒性评估带来额外难度。同时，数据来源集中于网络平台，可能存在地域饮食文化覆盖不均、图像质量参差等隐性问题，对算法的泛化能力提出更高要求。

常用场景

经典使用场景

在计算机视觉领域，食品图像分类作为一项基础任务，长期受到学术界与工业界的关注。Food-101数据集凭借其涵盖101类食品、共计101,000张图像的规模，成为该领域经典的基准数据集。其最经典的使用场景在于训练和评估深度卷积神经网络模型，特别是针对细粒度食品识别任务。由于训练集包含一定噪声，如色彩失真或错误标签，该数据集能够有效检验模型在非理想条件下的鲁棒性与泛化能力，常被用于图像分类算法的性能对比与优化研究。

解决学术问题

Food-101数据集的构建，直接回应了食品视觉识别中类别繁多、类间差异细微的学术挑战。它为解决细粒度图像分类问题提供了标准化的实验平台，使得研究者能够系统评估不同特征提取、数据增强及迁移学习策略的有效性。该数据集的存在，促进了模型对复杂真实世界场景的适应能力研究，尤其在处理类内多样性、类间相似性以及标注噪声方面，推动了计算机视觉算法在鲁棒性与准确性上的理论进展，对后续食品计算领域的范式形成产生了深远影响。

衍生相关工作

自Food-101数据集发布以来，其催生了一系列具有影响力的经典研究工作。例如，基于该数据集的迁移学习与领域自适应方法研究，显著提升了模型在有限标注数据下的性能。同时，围绕食品识别任务，研究者们提出了多种结合多模态信息（如食谱文本）的跨模态学习框架，进一步拓展了食品计算的研究边界。这些衍生工作不仅深化了我们对细粒度视觉识别的理解，也推动了相关模型在更广泛的实际场景中的部署与应用，形成了以Food-101为基石的研究脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集