five

Kwaai/food101|图像分类数据集|食物识别数据集

收藏
hugging_face2024-06-27 更新2024-06-29 收录
图像分类
食物识别
下载链接:
https://hf-mirror.com/datasets/Kwaai/food101
下载链接
链接失效反馈
资源简介:
该数据集名为Food-101,主要用于图像分类任务。数据集包含101种食物类别,共计101,000张图像。每个类别包含250张经过人工审核的测试图像和750张训练图像。训练图像未经过清洗,可能包含一些噪声,如颜色过于鲜艳或标签错误。所有图像的最大边长被调整为512像素。数据集分为训练集和验证集,训练集包含75,750张图像,验证集包含25,250张图像。数据集的字段包括图像和标签,图像为PIL.Image.Image对象,标签为整数分类标签。

该数据集名为Food-101,主要用于图像分类任务。数据集包含101种食物类别,共计101,000张图像。每个类别包含250张经过人工审核的测试图像和750张训练图像。训练图像未经过清洗,可能包含一些噪声,如颜色过于鲜艳或标签错误。所有图像的最大边长被调整为512像素。数据集分为训练集和验证集,训练集包含75,750张图像,验证集包含25,250张图像。数据集的字段包括图像和标签,图像为PIL.Image.Image对象,标签为整数分类标签。
提供机构:
Kwaai
原始信息汇总

Food-101 数据集概述

数据集基本信息

  • 名称: Food-101
  • 语言: 英语
  • 许可: 未知
  • 多语言性: 单语种
  • 数据量: 10K<n<100K
  • 来源: 扩展自其他数据集(foodspotting)
  • 任务类别: 图像分类
  • 任务ID: 多类别图像分类
  • PapersWithCode ID: food-101

数据集结构

特征

  • image: 图像数据,类型为 PIL.Image.Image
  • label: 分类标签,类型为 int,对应101种食物类别。

标签映射

  • 0: apple_pie
  • 1: baby_back_ribs
  • 2: baklava
  • 3: beef_carpaccio
  • 4: beef_tartare
  • 5: beet_salad
  • 6: beignets
  • 7: bibimbap
  • 8: bread_pudding
  • 9: breakfast_burrito
  • 10: bruschetta
  • 11: caesar_salad
  • 12: cannoli
  • 13: caprese_salad
  • 14: carrot_cake
  • 15: ceviche
  • 16: cheesecake
  • 17: cheese_plate
  • 18: chicken_curry
  • 19: chicken_quesadilla
  • 20: chicken_wings
  • 21: chocolate_cake
  • 22: chocolate_mousse
  • 23: churros
  • 24: clam_chowder
  • 25: club_sandwich
  • 26: crab_cakes
  • 27: creme_brulee
  • 28: croque_madame
  • 29: cup_cakes
  • 30: deviled_eggs
  • 31: donuts
  • 32: dumplings
  • 33: edamame
  • 34: eggs_benedict
  • 35: escargots
  • 36: falafel
  • 37: filet_mignon
  • 38: fish_and_chips
  • 39: foie_gras
  • 40: french_fries
  • 41: french_onion_soup
  • 42: french_toast
  • 43: fried_calamari
  • 44: fried_rice
  • 45: frozen_yogurt
  • 46: garlic_bread
  • 47: gnocchi
  • 48: greek_salad
  • 49: grilled_cheese_sandwich
  • 50: grilled_salmon
  • 51: guacamole
  • 52: gyoza
  • 53: hamburger
  • 54: hot_and_sour_soup
  • 55: hot_dog
  • 56: huevos_rancheros
  • 57: hummus
  • 58: ice_cream
  • 59: lasagna
  • 60: lobster_bisque
  • 61: lobster_roll_sandwich
  • 62: macaroni_and_cheese
  • 63: macarons
  • 64: miso_soup
  • 65: mussels
  • 66: nachos
  • 67: omelette
  • 68: onion_rings
  • 69: oysters
  • 70: pad_thai
  • 71: paella
  • 72: pancakes
  • 73: panna_cotta
  • 74: peking_duck
  • 75: pho
  • 76: pizza
  • 77: pork_chop
  • 78: poutine
  • 79: prime_rib
  • 80: pulled_pork_sandwich
  • 81: ramen
  • 82: ravioli
  • 83: red_velvet_cake
  • 84: risotto
  • 85: samosa
  • 86: sashimi
  • 87: scallops
  • 88: seaweed_salad
  • 89: shrimp_and_grits
  • 90: spaghetti_bolognese
  • 91: spaghetti_carbonara
  • 92: spring_rolls
  • 93: steak
  • 94: strawberry_shortcake
  • 95: sushi
  • 96: tacos
  • 97: takoyaki
  • 98: tiramisu
  • 99: tuna_tartare
  • 100: waffles

数据分割

  • 训练集: 75750个样本
  • 验证集: 25250个样本

数据集下载

  • 下载大小: 5059972308字节
  • 数据集大小: 5117839527.5字节
AI搜集汇总
数据集介绍
main_image_url
构建方式
Food-101数据集由101种食物类别组成,共计101,000张图像。每个类别包含250张手动审查的测试图像和750张训练图像。训练图像未经严格筛选,因此包含一定程度的噪声,主要表现为颜色过饱和和标签错误。所有图像均被调整为最大边长为512像素。
特点
Food-101数据集的主要特点在于其广泛的食物类别覆盖和图像多样性。尽管训练图像存在噪声,但这种设计有助于模型在实际应用中更好地泛化。此外,数据集的结构化分类标签和明确的训练与验证分割,使其成为图像分类任务的理想选择。
使用方法
使用Food-101数据集时,用户可以通过访问'image'和'label'字段来获取图像和对应的分类标签。建议先查询样本索引再访问'image'字段,以避免大量图像解码带来的性能问题。数据集适用于图像分类任务,特别是多类别图像分类,用户可以利用提供的训练和验证集进行模型训练和评估。
背景与挑战
背景概述
Food-101数据集由ETH Zurich的计算机视觉实验室创建,旨在推动食品图像分类领域的研究。该数据集包含101种食品类别,总计101,000张图像,每类食品提供250张手动审查的测试图像和750张训练图像。尽管训练图像未经严格清洗,存在一定噪声,但其广泛的应用和丰富的数据量使其成为图像分类研究的重要资源。Food-101数据集的发布,极大地促进了食品图像识别技术的发展,为相关领域的研究提供了坚实的基础。
当前挑战
Food-101数据集在构建过程中面临多项挑战。首先,图像的多样性和复杂性使得分类任务极具挑战性,尤其是在处理色彩鲜艳和标签错误的图像时。其次,数据集的规模庞大,处理和存储这些图像需要高效的计算资源和存储解决方案。此外,尽管数据集提供了丰富的食品类别,但每类食品的图像数量相对有限,可能导致模型在某些类别上的表现不佳。这些挑战不仅影响了数据集的质量,也对后续的模型训练和评估提出了更高的要求。
常用场景
经典使用场景
在计算机视觉领域,Kwaai/food101数据集被广泛用于图像分类任务,特别是多类别图像分类。该数据集包含了101种不同的食物类别,每类食物有1000张图片,总计101,000张图片。通过使用该数据集,研究人员可以训练和评估模型在复杂食物图像中的分类能力,从而推动图像识别技术的发展。
实际应用
在实际应用中,Kwaai/food101数据集被用于开发智能餐饮系统、食品识别应用和健康饮食建议平台。例如,通过训练基于该数据集的模型,餐饮系统可以自动识别顾客点的菜品,提高点餐效率;食品识别应用可以帮助用户快速识别食物成分,方便健康管理;健康饮食建议平台则可以根据用户的饮食习惯提供个性化的营养建议。
衍生相关工作
基于Kwaai/food101数据集,许多研究工作得以展开,包括但不限于改进的卷积神经网络(CNN)架构、迁移学习方法和数据增强技术。这些研究不仅提升了食物图像分类的性能,还推动了相关领域的技术进步。例如,一些研究通过引入注意力机制和多尺度特征融合,显著提高了模型的分类精度,为后续的图像识别研究提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录