Kwaai/food101

Name: Kwaai/food101
Creator: Kwaai
Published: 2024-06-27 09:30:12
License: 暂无描述

Hugging Face2024-06-27 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/Kwaai/food101

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Food-101，主要用于图像分类任务。数据集包含101种食物类别，共计101,000张图像。每个类别包含250张经过人工审核的测试图像和750张训练图像。训练图像未经过清洗，可能包含一些噪声，如颜色过于鲜艳或标签错误。所有图像的最大边长被调整为512像素。数据集分为训练集和验证集，训练集包含75,750张图像，验证集包含25,250张图像。数据集的字段包括图像和标签，图像为PIL.Image.Image对象，标签为整数分类标签。

提供机构：

Kwaai

原始信息汇总

Food-101 数据集概述

数据集基本信息

名称: Food-101
语言: 英语
许可: 未知
多语言性: 单语种
数据量: 10K<n<100K
来源: 扩展自其他数据集（foodspotting）
任务类别: 图像分类
任务ID: 多类别图像分类
PapersWithCode ID: food-101

数据集结构

特征

image: 图像数据，类型为 PIL.Image.Image。
label: 分类标签，类型为 int，对应101种食物类别。

标签映射

0: apple_pie
1: baby_back_ribs
2: baklava
3: beef_carpaccio
4: beef_tartare
5: beet_salad
6: beignets
7: bibimbap
8: bread_pudding
9: breakfast_burrito
10: bruschetta
11: caesar_salad
12: cannoli
13: caprese_salad
14: carrot_cake
15: ceviche
16: cheesecake
17: cheese_plate
18: chicken_curry
19: chicken_quesadilla
20: chicken_wings
21: chocolate_cake
22: chocolate_mousse
23: churros
24: clam_chowder
25: club_sandwich
26: crab_cakes
27: creme_brulee
28: croque_madame
29: cup_cakes
30: deviled_eggs
31: donuts
32: dumplings
33: edamame
34: eggs_benedict
35: escargots
36: falafel
37: filet_mignon
38: fish_and_chips
39: foie_gras
40: french_fries
41: french_onion_soup
42: french_toast
43: fried_calamari
44: fried_rice
45: frozen_yogurt
46: garlic_bread
47: gnocchi
48: greek_salad
49: grilled_cheese_sandwich
50: grilled_salmon
51: guacamole
52: gyoza
53: hamburger
54: hot_and_sour_soup
55: hot_dog
56: huevos_rancheros
57: hummus
58: ice_cream
59: lasagna
60: lobster_bisque
61: lobster_roll_sandwich
62: macaroni_and_cheese
63: macarons
64: miso_soup
65: mussels
66: nachos
67: omelette
68: onion_rings
69: oysters
70: pad_thai
71: paella
72: pancakes
73: panna_cotta
74: peking_duck
75: pho
76: pizza
77: pork_chop
78: poutine
79: prime_rib
80: pulled_pork_sandwich
81: ramen
82: ravioli
83: red_velvet_cake
84: risotto
85: samosa
86: sashimi
87: scallops
88: seaweed_salad
89: shrimp_and_grits
90: spaghetti_bolognese
91: spaghetti_carbonara
92: spring_rolls
93: steak
94: strawberry_shortcake
95: sushi
96: tacos
97: takoyaki
98: tiramisu
99: tuna_tartare
100: waffles

数据分割

训练集: 75750个样本
验证集: 25250个样本

数据集下载

下载大小: 5059972308字节
数据集大小: 5117839527.5字节

搜集汇总

数据集介绍

构建方式

Food-101数据集由101种食物类别组成，共计101,000张图像。每个类别包含250张手动审查的测试图像和750张训练图像。训练图像未经严格筛选，因此包含一定程度的噪声，主要表现为颜色过饱和和标签错误。所有图像均被调整为最大边长为512像素。

特点

Food-101数据集的主要特点在于其广泛的食物类别覆盖和图像多样性。尽管训练图像存在噪声，但这种设计有助于模型在实际应用中更好地泛化。此外，数据集的结构化分类标签和明确的训练与验证分割，使其成为图像分类任务的理想选择。

使用方法

使用Food-101数据集时，用户可以通过访问'image'和'label'字段来获取图像和对应的分类标签。建议先查询样本索引再访问'image'字段，以避免大量图像解码带来的性能问题。数据集适用于图像分类任务，特别是多类别图像分类，用户可以利用提供的训练和验证集进行模型训练和评估。

背景与挑战

背景概述

Food-101数据集由ETH Zurich的计算机视觉实验室创建，旨在推动食品图像分类领域的研究。该数据集包含101种食品类别，总计101,000张图像，每类食品提供250张手动审查的测试图像和750张训练图像。尽管训练图像未经严格清洗，存在一定噪声，但其广泛的应用和丰富的数据量使其成为图像分类研究的重要资源。Food-101数据集的发布，极大地促进了食品图像识别技术的发展，为相关领域的研究提供了坚实的基础。

当前挑战

Food-101数据集在构建过程中面临多项挑战。首先，图像的多样性和复杂性使得分类任务极具挑战性，尤其是在处理色彩鲜艳和标签错误的图像时。其次，数据集的规模庞大，处理和存储这些图像需要高效的计算资源和存储解决方案。此外，尽管数据集提供了丰富的食品类别，但每类食品的图像数量相对有限，可能导致模型在某些类别上的表现不佳。这些挑战不仅影响了数据集的质量，也对后续的模型训练和评估提出了更高的要求。

常用场景

经典使用场景

在计算机视觉领域，Kwaai/food101数据集被广泛用于图像分类任务，特别是多类别图像分类。该数据集包含了101种不同的食物类别，每类食物有1000张图片，总计101,000张图片。通过使用该数据集，研究人员可以训练和评估模型在复杂食物图像中的分类能力，从而推动图像识别技术的发展。

实际应用

在实际应用中，Kwaai/food101数据集被用于开发智能餐饮系统、食品识别应用和健康饮食建议平台。例如，通过训练基于该数据集的模型，餐饮系统可以自动识别顾客点的菜品，提高点餐效率；食品识别应用可以帮助用户快速识别食物成分，方便健康管理；健康饮食建议平台则可以根据用户的饮食习惯提供个性化的营养建议。

衍生相关工作

基于Kwaai/food101数据集，许多研究工作得以展开，包括但不限于改进的卷积神经网络（CNN）架构、迁移学习方法和数据增强技术。这些研究不仅提升了食物图像分类的性能，还推动了相关领域的技术进步。例如，一些研究通过引入注意力机制和多尺度特征融合，显著提高了模型的分类精度，为后续的图像识别研究提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集