pri12354/indian_food_images
收藏Hugging Face2024-03-12 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/pri12354/indian_food_images
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像和标签两个主要特征。图像特征的数据类型为image,标签特征的数据类型为class_label,并且标签有80个不同的类别,涵盖了多种印度菜肴和甜点。数据集分为训练集和测试集,训练集包含3400个样本,测试集包含600个样本。数据集的下载大小为376169463字节,总大小为398880575.2字节。
This dataset includes two primary features: image and label. The image feature is of the `image` data type, while the label feature is of the `class_label` data type. There are 80 distinct label categories, covering a variety of Indian dishes and desserts. The dataset is split into training and test sets, with the training set containing 3400 samples and the test set holding 600 samples. The download size of the dataset is 376169463 bytes, and its total storage size is 398880575.2 bytes.
提供机构:
pri12354
原始信息汇总
数据集概述
数据集特征
- image: 图像数据类型
- label: 类别标签数据类型,包含以下类别:
- 0: adhirasam
- 1: aloo_gobi
- 2: aloo_matar
- 3: aloo_methi
- 4: aloo_shimla_mirch
- 5: aloo_tikki
- 6: anarsa
- 7: ariselu
- 8: bandar_laddu
- 9: basundi
- 10: bhatura
- 11: bhindi_masala
- 12: biryani
- 13: boondi
- 14: butter_chicken
- 15: chak_hao_kheer
- 16: cham_cham
- 17: chana_masala
- 18: chapati
- 19: chhena_kheeri
- 20: chicken_razala
- 21: chicken_tikka
- 22: chicken_tikka_masala
- 23: chikki
- 24: daal_baati_churma
- 25: daal_puri
- 26: dal_makhani
- 27: dal_tadka
- 28: dharwad_pedha
- 29: doodhpak
- 30: double_ka_meetha
- 31: dum_aloo
- 32: gajar_ka_halwa
- 33: gavvalu
- 34: ghevar
- 35: gulab_jamun
- 36: imarti
- 37: jalebi
- 38: kachori
- 39: kadai_paneer
- 40: kadhi_pakoda
- 41: kajjikaya
- 42: kakinada_khaja
- 43: kalakand
- 44: karela_bharta
- 45: kofta
- 46: kuzhi_paniyaram
- 47: lassi
- 48: ledikeni
- 49: litti_chokha
- 50: lyangcha
- 51: maach_jhol
- 52: makki_di_roti_sarson_da_saag
- 53: malapua
- 54: misi_roti
- 55: misti_doi
- 56: modak
- 57: mysore_pak
- 58: naan
- 59: navrattan_korma
- 60: palak_paneer
- 61: paneer_butter_masala
- 62: phirni
- 63: pithe
- 64: poha
- 65: poornalu
- 66: pootharekulu
- 67: qubani_ka_meetha
- 68: rabri
- 69: ras_malai
- 70: rasgulla
- 71: sandesh
- 72: shankarpali
- 73: sheer_korma
- 74: sheera
- 75: shrikhand
- 76: sohan_halwa
- 77: sohan_papdi
- 78: sutar_feni
- 79: unni_appam
数据集分割
- train: 训练集,包含3400个样本,总大小为342374935.7字节
- test: 测试集,包含600个样本,总大小为56505639.5字节
数据集大小
- 下载大小: 376169463字节
- 数据集总大小: 398880575.2字节
配置文件
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
搜集汇总
数据集介绍

构建方式
在计算机视觉与美食文化交叉领域,Indian Food Images数据集通过系统化采集与标注流程构建而成。该数据集包含总计4000张图像,划分为3400张训练样本与600张测试样本,涵盖80种印度传统菜肴类别。每张图像均经过人工或自动化标注流程,确保图像与标签的精确对应,形成结构化视觉数据库,为跨文化美食识别研究提供标准化数据基础。
特点
该数据集以印度饮食文化多样性为核心特征,完整覆盖从甜点至主菜的80类代表性菜肴,包括adhirasam、biryani、gulab_jamun等地域特色品类。图像数据呈现丰富视觉差异,涵盖不同摆盘风格、光照条件与拍摄角度,有效模拟真实场景的识别挑战。数据集采用平衡划分策略,训练集与测试集容量比例约为5.7:1,为模型泛化能力评估提供可靠基准。
使用方法
在美食图像分类任务中,研究者可基于该数据集构建端到端的深度学习模型。典型流程包括使用卷积神经网络提取图像特征,结合迁移学习技术优化模型性能。数据集采用标准图像分类格式,支持直接加载至TensorFlow或PyTorch等框架,通过划分的训练集进行模型训练,并在独立测试集上验证分类准确率,最终实现自动化印度菜肴识别系统。
背景与挑战
背景概述
在计算机视觉与美食计算交叉领域,印度菜肴图像数据集pri12354/indian_food_images的构建标志着对多元饮食文化数字化表征的重要探索。该数据集由研究人员或开源贡献者于近年汇编,聚焦于印度丰富的地方性烹饪传统,旨在通过图像识别技术自动分类多达80种特色菜肴与甜点。其核心研究问题在于解决美食图像中因地域差异、烹饪变体及视觉相似性所导致的细粒度分类难题,为食品识别、营养分析与文化保护等应用提供基准数据支撑,推动了跨文化饮食计算模型的发展。
当前挑战
该数据集面临的挑战主要体现在两方面:其一,在领域问题层面,印度菜肴具有高度的类内多样性与类间相似性,例如不同地区的同种菜肴在配料、摆盘上存在显著差异,而甜点如gulab_jamun与rasgulla在视觉上易混淆,这对模型的细粒度判别能力提出了严峻考验;其二,在构建过程中,数据收集需克服菜肴地域分布不均、图像质量参差以及标注一致性维护等困难,例如确保每种菜肴样本的代表性与平衡性,同时处理光照、角度及背景噪声带来的干扰,这些因素均增加了数据集构建的复杂性与可靠性保障难度。
常用场景
经典使用场景
在计算机视觉与美食文化交叉领域,Indian Food Images数据集为图像分类任务提供了丰富的视觉素材。该数据集汇集了80种印度传统菜肴的高质量图像,涵盖从主菜到甜点的广泛类别,成为训练和评估深度学习模型,特别是卷积神经网络(CNN)在细粒度食品识别方面性能的基准资源。研究者常利用其构建多类分类器,以探索模型在复杂视觉模式下的判别能力。
实际应用
在实际应用层面,该数据集为智能餐饮服务与健康管理提供了技术支撑。基于其训练的模型可集成于手机应用或餐厅系统中,实现菜肴的自动识别与营养信息估算,辅助用户进行饮食记录与健康管理。在餐饮行业,该技术能用于智能点餐推荐、菜品质量监控及供应链管理,提升服务效率与用户体验,并助力印度美食文化的数字化传播与推广。
衍生相关工作
围绕Indian Food Images数据集,已衍生出多项经典研究工作。学者们利用该数据集探索了如EfficientNet、Vision Transformer等先进架构在食品识别上的适应性,并发表了相关性能基准分析。同时,研究工作也聚焦于解决类别不平衡、小样本学习等问题,催生了针对食品图像的数据增强策略和领域自适应方法,这些成果进一步丰富了食品计算与细粒度视觉分析的研究图景。
以上内容由遇见数据集搜集并总结生成



