Kwaai/food101
收藏Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Kwaai/food101
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Food-101,主要用于图像分类任务。数据集包含101种食物类别,共计101,000张图像。每个类别包含250张经过人工审核的测试图像和750张训练图像。训练图像未经过清洗,可能包含一些噪声,如颜色过于鲜艳或标签错误。所有图像的最大边长被调整为512像素。数据集分为训练集和验证集,训练集包含75,750张图像,验证集包含25,250张图像。数据集的字段包括图像和标签,图像为PIL.Image.Image对象,标签为整数分类标签。
该数据集名为Food-101,主要用于图像分类任务。数据集包含101种食物类别,共计101,000张图像。每个类别包含250张经过人工审核的测试图像和750张训练图像。训练图像未经过清洗,可能包含一些噪声,如颜色过于鲜艳或标签错误。所有图像的最大边长被调整为512像素。数据集分为训练集和验证集,训练集包含75,750张图像,验证集包含25,250张图像。数据集的字段包括图像和标签,图像为PIL.Image.Image对象,标签为整数分类标签。
提供机构:
Kwaai
原始信息汇总
Food-101 数据集概述
数据集基本信息
- 名称: Food-101
- 语言: 英语
- 许可: 未知
- 多语言性: 单语种
- 数据量: 10K<n<100K
- 来源: 扩展自其他数据集(foodspotting)
- 任务类别: 图像分类
- 任务ID: 多类别图像分类
- PapersWithCode ID: food-101
数据集结构
特征
- image: 图像数据,类型为
PIL.Image.Image。 - label: 分类标签,类型为
int,对应101种食物类别。
标签映射
- 0: apple_pie
- 1: baby_back_ribs
- 2: baklava
- 3: beef_carpaccio
- 4: beef_tartare
- 5: beet_salad
- 6: beignets
- 7: bibimbap
- 8: bread_pudding
- 9: breakfast_burrito
- 10: bruschetta
- 11: caesar_salad
- 12: cannoli
- 13: caprese_salad
- 14: carrot_cake
- 15: ceviche
- 16: cheesecake
- 17: cheese_plate
- 18: chicken_curry
- 19: chicken_quesadilla
- 20: chicken_wings
- 21: chocolate_cake
- 22: chocolate_mousse
- 23: churros
- 24: clam_chowder
- 25: club_sandwich
- 26: crab_cakes
- 27: creme_brulee
- 28: croque_madame
- 29: cup_cakes
- 30: deviled_eggs
- 31: donuts
- 32: dumplings
- 33: edamame
- 34: eggs_benedict
- 35: escargots
- 36: falafel
- 37: filet_mignon
- 38: fish_and_chips
- 39: foie_gras
- 40: french_fries
- 41: french_onion_soup
- 42: french_toast
- 43: fried_calamari
- 44: fried_rice
- 45: frozen_yogurt
- 46: garlic_bread
- 47: gnocchi
- 48: greek_salad
- 49: grilled_cheese_sandwich
- 50: grilled_salmon
- 51: guacamole
- 52: gyoza
- 53: hamburger
- 54: hot_and_sour_soup
- 55: hot_dog
- 56: huevos_rancheros
- 57: hummus
- 58: ice_cream
- 59: lasagna
- 60: lobster_bisque
- 61: lobster_roll_sandwich
- 62: macaroni_and_cheese
- 63: macarons
- 64: miso_soup
- 65: mussels
- 66: nachos
- 67: omelette
- 68: onion_rings
- 69: oysters
- 70: pad_thai
- 71: paella
- 72: pancakes
- 73: panna_cotta
- 74: peking_duck
- 75: pho
- 76: pizza
- 77: pork_chop
- 78: poutine
- 79: prime_rib
- 80: pulled_pork_sandwich
- 81: ramen
- 82: ravioli
- 83: red_velvet_cake
- 84: risotto
- 85: samosa
- 86: sashimi
- 87: scallops
- 88: seaweed_salad
- 89: shrimp_and_grits
- 90: spaghetti_bolognese
- 91: spaghetti_carbonara
- 92: spring_rolls
- 93: steak
- 94: strawberry_shortcake
- 95: sushi
- 96: tacos
- 97: takoyaki
- 98: tiramisu
- 99: tuna_tartare
- 100: waffles
数据分割
- 训练集: 75750个样本
- 验证集: 25250个样本
数据集下载
- 下载大小: 5059972308字节
- 数据集大小: 5117839527.5字节
搜集汇总
数据集介绍

构建方式
Food-101数据集由101种食物类别组成,共计101,000张图像。每个类别包含250张手动审查的测试图像和750张训练图像。训练图像未经严格筛选,因此包含一定程度的噪声,主要表现为颜色过饱和和标签错误。所有图像均被调整为最大边长为512像素。
特点
Food-101数据集的主要特点在于其广泛的食物类别覆盖和图像多样性。尽管训练图像存在噪声,但这种设计有助于模型在实际应用中更好地泛化。此外,数据集的结构化分类标签和明确的训练与验证分割,使其成为图像分类任务的理想选择。
使用方法
使用Food-101数据集时,用户可以通过访问'image'和'label'字段来获取图像和对应的分类标签。建议先查询样本索引再访问'image'字段,以避免大量图像解码带来的性能问题。数据集适用于图像分类任务,特别是多类别图像分类,用户可以利用提供的训练和验证集进行模型训练和评估。
背景与挑战
背景概述
Food-101数据集由ETH Zurich的计算机视觉实验室创建,旨在推动食品图像分类领域的研究。该数据集包含101种食品类别,总计101,000张图像,每类食品提供250张手动审查的测试图像和750张训练图像。尽管训练图像未经严格清洗,存在一定噪声,但其广泛的应用和丰富的数据量使其成为图像分类研究的重要资源。Food-101数据集的发布,极大地促进了食品图像识别技术的发展,为相关领域的研究提供了坚实的基础。
当前挑战
Food-101数据集在构建过程中面临多项挑战。首先,图像的多样性和复杂性使得分类任务极具挑战性,尤其是在处理色彩鲜艳和标签错误的图像时。其次,数据集的规模庞大,处理和存储这些图像需要高效的计算资源和存储解决方案。此外,尽管数据集提供了丰富的食品类别,但每类食品的图像数量相对有限,可能导致模型在某些类别上的表现不佳。这些挑战不仅影响了数据集的质量,也对后续的模型训练和评估提出了更高的要求。
常用场景
经典使用场景
在计算机视觉领域,Kwaai/food101数据集被广泛用于图像分类任务,特别是多类别图像分类。该数据集包含了101种不同的食物类别,每类食物有1000张图片,总计101,000张图片。通过使用该数据集,研究人员可以训练和评估模型在复杂食物图像中的分类能力,从而推动图像识别技术的发展。
实际应用
在实际应用中,Kwaai/food101数据集被用于开发智能餐饮系统、食品识别应用和健康饮食建议平台。例如,通过训练基于该数据集的模型,餐饮系统可以自动识别顾客点的菜品,提高点餐效率;食品识别应用可以帮助用户快速识别食物成分,方便健康管理;健康饮食建议平台则可以根据用户的饮食习惯提供个性化的营养建议。
衍生相关工作
基于Kwaai/food101数据集,许多研究工作得以展开,包括但不限于改进的卷积神经网络(CNN)架构、迁移学习方法和数据增强技术。这些研究不仅提升了食物图像分类的性能,还推动了相关领域的技术进步。例如,一些研究通过引入注意力机制和多尺度特征融合,显著提高了模型的分类精度,为后续的图像识别研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



