DarkKnight7007/indian_food_images
收藏Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DarkKnight7007/indian_food_images
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': adhirasam
'1': aloo_gobi
'2': aloo_matar
'3': aloo_methi
'4': aloo_shimla_mirch
'5': aloo_tikki
'6': anarsa
'7': ariselu
'8': bandar_laddu
'9': basundi
'10': bhatura
'11': bhindi_masala
'12': biryani
'13': boondi
'14': butter_chicken
'15': chak_hao_kheer
'16': cham_cham
'17': chana_masala
'18': chapati
'19': chhena_kheeri
'20': chicken_razala
'21': chicken_tikka
'22': chicken_tikka_masala
'23': chikki
'24': daal_baati_churma
'25': daal_puri
'26': dal_makhani
'27': dal_tadka
'28': dharwad_pedha
'29': doodhpak
'30': double_ka_meetha
'31': dum_aloo
'32': gajar_ka_halwa
'33': gavvalu
'34': ghevar
'35': gulab_jamun
'36': imarti
'37': jalebi
'38': kachori
'39': kadai_paneer
'40': kadhi_pakoda
'41': kajjikaya
'42': kakinada_khaja
'43': kalakand
'44': karela_bharta
'45': kofta
'46': kuzhi_paniyaram
'47': lassi
'48': ledikeni
'49': litti_chokha
'50': lyangcha
'51': maach_jhol
'52': makki_di_roti_sarson_da_saag
'53': malapua
'54': misi_roti
'55': misti_doi
'56': modak
'57': mysore_pak
'58': naan
'59': navrattan_korma
'60': palak_paneer
'61': paneer_butter_masala
'62': phirni
'63': pithe
'64': poha
'65': poornalu
'66': pootharekulu
'67': qubani_ka_meetha
'68': rabri
'69': ras_malai
'70': rasgulla
'71': sandesh
'72': shankarpali
'73': sheer_korma
'74': sheera
'75': shrikhand
'76': sohan_halwa
'77': sohan_papdi
'78': sutar_feni
'79': unni_appam
splits:
- name: train
num_bytes: 284955599.7
num_examples: 3400
- name: test
num_bytes: 63675325.5
num_examples: 600
download_size: 375576787
dataset_size: 348630925.2
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
提供机构:
DarkKnight7007
原始信息汇总
数据集概述
特征
- image: 图像数据
- label: 类别标签
- 类别名称:
- 0: adhirasam
- 1: aloo_gobi
- 2: aloo_matar
- 3: aloo_methi
- 4: aloo_shimla_mirch
- 5: aloo_tikki
- 6: anarsa
- 7: ariselu
- 8: bandar_laddu
- 9: basundi
- 10: bhatura
- 11: bhindi_masala
- 12: biryani
- 13: boondi
- 14: butter_chicken
- 15: chak_hao_kheer
- 16: cham_cham
- 17: chana_masala
- 18: chapati
- 19: chhena_kheeri
- 20: chicken_razala
- 21: chicken_tikka
- 22: chicken_tikka_masala
- 23: chikki
- 24: daal_baati_churma
- 25: daal_puri
- 26: dal_makhani
- 27: dal_tadka
- 28: dharwad_pedha
- 29: doodhpak
- 30: double_ka_meetha
- 31: dum_aloo
- 32: gajar_ka_halwa
- 33: gavvalu
- 34: ghevar
- 35: gulab_jamun
- 36: imarti
- 37: jalebi
- 38: kachori
- 39: kadai_paneer
- 40: kadhi_pakoda
- 41: kajjikaya
- 42: kakinada_khaja
- 43: kalakand
- 44: karela_bharta
- 45: kofta
- 46: kuzhi_paniyaram
- 47: lassi
- 48: ledikeni
- 49: litti_chokha
- 50: lyangcha
- 51: maach_jhol
- 52: makki_di_roti_sarson_da_saag
- 53: malapua
- 54: misi_roti
- 55: misti_doi
- 56: modak
- 57: mysore_pak
- 58: naan
- 59: navrattan_korma
- 60: palak_paneer
- 61: paneer_butter_masala
- 62: phirni
- 63: pithe
- 64: poha
- 65: poornalu
- 66: pootharekulu
- 67: qubani_ka_meetha
- 68: rabri
- 69: ras_malai
- 70: rasgulla
- 71: sandesh
- 72: shankarpali
- 73: sheer_korma
- 74: sheera
- 75: shrikhand
- 76: sohan_halwa
- 77: sohan_papdi
- 78: sutar_feni
- 79: unni_appam
- 类别名称:
数据分割
- train:
- 字节数: 284955599.7
- 样本数: 3400
- test:
- 字节数: 63675325.5
- 样本数: 600
数据大小
- 下载大小: 375576787
- 数据集大小: 348630925.2
配置
- config_name: default
- 数据文件:
- train: data/train-*
- test: data/test-*
- 数据文件:
搜集汇总
数据集介绍

构建方式
该数据集旨在为印度菜肴的视觉识别提供标准化资源,涵盖了从传统甜点到主食的丰富类别。构建过程通过系统化采集与筛选,最终收录了来自80个不同菜品的图像数据,包括Adhirasam、Biryani、Butter Chicken等代表性美食。数据集划分为训练集与测试集,训练集包含3400张图像,测试集包含600张图像,确保了模型训练与评估的独立性与可靠性。所有图像均以统一格式存储,并配有对应的标签信息,标签采用整数编码映射至具体菜品名称,便于后续的监督学习任务。
特点
该数据集的核心特点在于其广泛的菜品覆盖度与精细的类别划分,共涵盖80种印度传统与现代菜肴,从地域性小食到全国知名佳肴一应俱全。每张图像均附带明确的类别标签,支持多分类任务的直接应用。数据集规模适中,训练集与测试集的比例约为5.67:1,既提供了充足的训练样本以学习视觉特征,又保留了独立的测试集用于性能评估。此外,图像数据以通用格式存储,兼容主流深度学习框架,降低了预处理复杂度。
使用方法
使用该数据集时,可直接通过HuggingFace Datasets库加载默认配置,自动获取训练与测试分片。图像数据以张量形式读取,标签作为整数索引对应预定义的类别列表。用户可根据任务需求对图像进行标准化、缩放或数据增强等预处理。对于分类模型,可采用交叉熵损失函数进行训练,并利用测试集计算准确率等指标。该数据集亦适用于迁移学习场景,可基于预训练视觉模型进行微调,以提升在印度菜品识别任务上的性能。
背景与挑战
背景概述
在全球饮食文化日益交融的当下,印度菜系以其丰富的香料运用与多样化的烹饪技法独树一帜,然而其视觉识别研究却长期受限于高质量标注数据的匮乏。DarkKnight7007/indian_food_images数据集由研究者于近年创建,旨在填补这一空白,聚焦于印度次大陆从日常主食到节庆甜点的精细分类。该数据集涵盖80个常见类别,如biryani、gulab_jamun与butter_chicken,共计3400张训练图像与600张测试图像,为计算机视觉领域在食物识别方向提供了极具文化特色的基准资源。其核心研究问题在于如何通过有限但多样化的视觉样本,准确区分形态相近的印度菜肴,从而推动跨文化食品图像理解技术的发展。
当前挑战
该数据集所面临的挑战首先体现在领域问题的复杂性上:印度菜肴往往具有高度相似的外观,例如不同种类的咖喱或甜点可能仅在纹理或装饰细节上存在差异,这对细粒度图像分类算法提出了严苛要求。此外,构建过程中,由于印度烹饪区域差异显著,同一菜品在不同家庭或餐厅的呈现形态千差万别,导致标注一致性难以保证。数据集的规模亦构成瓶颈——仅3400张训练样本对于80类分类任务而言相对不足,易引发模型过拟合与泛化能力不足的问题。光照条件、拍摄角度以及背景噪声的多样性进一步加剧了图像识别的难度,使得该数据集在推动鲁棒性算法设计方面具有独特的研究价值。
常用场景
经典使用场景
在计算机视觉与美食计算交叉研究领域,Indian Food Images数据集以其独特的文化多样性和视觉复杂性,成为细粒度图像分类任务的理想基准。该数据集涵盖80种经典印度菜肴,从北印度的黄油鸡到南印度的阿普姆,每种菜肴均以真实烹饪场景中的原始图像呈现,为模型提供了丰富的纹理、色彩与摆盘特征。研究者常借助该数据集训练卷积神经网络或视觉Transformer,探索如何在高度相似的菜肴类别间(如不同种类的甜点或咖喱)实现精准判别,从而推动多类别、高混淆度美食图像识别技术的发展。
实际应用
在实际应用层面,该数据集为智能饮食管理、自动化菜单推荐与文化遗产数字化保护提供了核心支撑。基于该数据集训练的模型可集成至移动端应用,帮助用户通过拍照即时识别菜肴名称与营养成分,辅助糖尿病患者或过敏人群进行饮食决策。此外,该技术还能赋能餐饮行业,实现后厨菜品自动归档、外卖平台视觉搜索等功能,显著提升运营效率。在文化传承领域,该数据集为印度地方性传统菜肴的数字化建档与传播奠定了技术根基,助力全球用户通过视觉交互了解南亚饮食文化。
衍生相关工作
围绕该数据集,学术界已衍生出多项具有影响力的研究工作。部分团队基于其类别结构构建了多层次美食知识图谱,将视觉特征与食谱成分、地域起源关联,实现了从图像到烹饪逻辑的跨模态推理。另有研究者将其与多语言文本描述结合,开发出面向印度菜肴的图像描述生成与跨文化推荐系统。在模型轻量化领域,该数据集被用于验证知识蒸馏与剪枝技术在细粒度分类任务中的有效性,推动了边缘设备上的实时美食识别系统落地。这些工作共同构成了从视觉感知到语义理解的美食计算研究闭环。
以上内容由遇见数据集搜集并总结生成



