Khana
收藏github2025-09-16 更新2025-09-21 收录
下载链接:
https://github.com/prabhuomkar/Khana
下载链接
链接失效反馈官方服务:
资源简介:
Khana是一个食物分类数据集,包含印度美食的各种菜肴。该数据集旨在解决现有数据集中的挑战:缺乏印度食物菜肴的代表性,由于受西方影响的类别、条件、视角和环境而导致的有限多样性泛化。数据集包含131,000多张图像,涵盖80种食物菜肴。
Khana is a food classification dataset encompassing various Indian culinary dishes. This dataset is designed to address the key challenges prevalent in existing datasets: the insufficient representativeness of Indian food dishes, and the limited generalization capability caused by Western-influenced category settings, collection conditions, shooting perspectives and surrounding environments. It contains more than 131,000 images covering 80 distinct food dishes.
创建时间:
2025-08-25
原始信息汇总
Khana: 印度美食数据集概述
数据集简介
Khana是一个专注于印度菜系的食品分类数据集,旨在解决现有数据集中印度食品代表性不足、因西方影响类别导致的多样性有限等问题。
核心特征
- 图像数量:超过131,000张
- 菜肴类别:80种印度食品
- 数据来源:网络图像编译(无版权持有)
- 适用对象:研究人员和教育工作者
- 使用限制:仅限非商业研究或教育用途
数据内容
数据集包含印度菜系多种菜肴的图像,涵盖广泛的类别多样性。
获取方式
- 下载地址:https://drive.google.com/drive/folders/1PWyJdkizw5ABBd8BIAnr_FZq91YZ2Uo0?usp=sharing
- 标签文件:可从数据集下载
- 分类体系:提供创建时制定的分类法
学术引用
bibtex @misc{prabhu2025, title={Khana: A Comprehensive Indian Cuisine Dataset}, author={Omkar Prabhu}, year={2025}, eprint={2509.06006}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2509.06006}, }
搜集汇总
数据集介绍

构建方式
在计算机视觉与食品识别研究领域,构建具有文化多样性的数据集至关重要。Khana数据集通过系统化采集网络公开图像资源,整合了超过13.1万张印度菜肴图像,涵盖80个具有地域特色的食物类别。数据构建过程注重来源多样性与标注一致性,采用人工校验与自动化流程相结合的方式,确保每张图像准确对应特定菜肴类别,并遵循非商业研究用途的版权规范。
特点
该数据集显著提升了印度餐饮文化在食品计算研究中的代表性,其图像内容覆盖多种拍摄环境、视角及呈现条件,突破了传统数据集中西方饮食文化主导的局限性。类别设计兼顾了南北印度菜系的地域差异,包含从街头小吃到传统宴席菜肴的丰富样本,为模型训练提供了高泛化性的视觉特征基础。
使用方法
研究者可通过公开的Google Drive链接获取数据集压缩文件,解压后按类别分文件夹组织图像。每张图像均附带标准化标签,支持直接用于图像分类、跨域识别或细粒度视觉分析任务。使用前需遵循非商业研究授权协议,建议结合数据增强技术处理光照、角度等环境变量,以充分发挥其多元文化样本的价值。
背景与挑战
背景概述
印度饮食文化作为全球最具多样性的烹饪体系之一,长期以来在计算机视觉领域的食物识别研究中缺乏系统性的数据支持。Khana数据集由研究者Omkar Prabhu于2025年构建,旨在填补印度菜肴在图像分类任务中的表征空白。该数据集包含超过13.1万张图像,涵盖80种经典印度菜品种类,通过系统化采集网络图像资源构建而成。其诞生显著提升了多模态食物识别模型对非西方饮食文化的认知广度,为跨文化饮食计算研究提供了关键基础设施。
当前挑战
该数据集核心解决印度菜肴因视觉特征复杂、地域变体丰富导致的自动分类难题,其挑战体现在咖喱类菜肴视觉相似度高、同一菜肴在不同地区的呈现差异显著等方面。构建过程中需克服网络图像质量参差不齐的困难,包括用户生成内容中存在遮挡、光照异常及背景干扰等问题,同时需确保80个菜品类别的视觉表征均衡性,避免因地理文化偏差导致的数据倾斜。
常用场景
经典使用场景
在计算机视觉与美食计算交叉领域,Khana数据集为印度菜肴识别任务提供了标准化基准。研究者通常利用其13万余张图像数据训练深度卷积神经网络,通过迁移学习技术优化模型在多元餐饮环境下的分类精度,特别是在处理光线变化、餐具摆放及食材纹理等复杂变量时展现出色鲁棒性。
解决学术问题
该数据集有效解决了美食计算中非西方饮食文化代表性不足的学术困境。通过构建涵盖80类印度本土菜肴的视觉数据库,它不仅填补了跨文化食品识别研究的空白,更为探究多模态饮食行为分析、地域性饮食习惯建模提供了数据基础,推动了饮食文化数字化保护的学术进程。
衍生相关工作
该数据集催生了多项创新研究,包括结合注意力机制的FusionFoodNet跨文化食品识别框架、基于图卷积网络的区域性饮食图谱构建方法。部分研究进一步扩展其应用边界,开发出支持多语言描述的食谱生成系统,以及融合嗅觉模拟器的多感官饮食体验交互装置。
以上内容由遇见数据集搜集并总结生成



