Codatta/MM-Food-100K
收藏Hugging Face2025-08-18 更新2025-09-13 收录
下载链接:
https://hf-mirror.com/datasets/Codatta/MM-Food-100K
下载链接
链接失效反馈官方服务:
资源简介:
这是一个专门为计算机视觉任务设计的综合食品图像数据集,特别适用于食品识别、分类和营养分析。数据集包含高质量的食品图像和详细的元数据,旨在进行细粒度的食品分析。与传统的仅提供图像分类标签的数据集不同,该资源提供了多级结构化信息,支持更复杂的AI应用程序。每个数据记录都包括一个图像URL和相应的JSON格式的元数据,包含菜品名称、食品类型、配料、份量、营养信息、烹饪方法和图像来源概率等字段。数据集由10万张食品图像组成,涵盖了各种食品类型,包括自制食品、餐厅食品、生蔬果和包装食品。数据收集和标注过程采用了创新的混合标注方法,结合大规模众包数据、人工预标注和先进的AI模型,确保了数据集的高质量和准确性。数据集可用于食品识别和分类、营养评估、食谱推荐系统、健康管理、餐厅自动化和计算机视觉研究等应用。
This is a comprehensive food image dataset designed specifically for computer vision tasks, particularly food recognition, classification, and nutritional analysis. The dataset consists of high-quality food images and detailed metadata, designed for granular food analysis. Unlike traditional datasets that only provide image classification labels, our resource offers multi-level, structured information that supports more complex AI applications. Each data record includes an image URL and corresponding metadata in JSON format, containing fields such as dish name, food type, ingredients, portion size, nutritional profile, cooking method, and image source probability. The dataset is composed of 100,000 food images, covering various food types including homemade food, restaurant food, raw vegetables and fruits, and packaged food. The data collection and annotation process uses an innovative hybrid annotation method, combining large-scale crowdsourced data, human pre-annotation, and advanced AI models to ensure the high quality and accuracy of the dataset. The dataset can be used for food recognition and classification, nutritional estimation, recipe recommendation systems, health management, restaurant automation, and computer vision research applications.
提供机构:
Codatta
搜集汇总
数据集介绍

构建方式
在食品智能分析领域,构建高质量数据集是推动精准营养计算与健康管理应用发展的基石。MM-Food-100K数据集的构建采用了一种创新的混合标注流程,其核心在于融合大规模众包数据、人工预标注与先进多模态模型的协同作用。初始阶段,通过Codatta与Binance合作的Booster活动,收集了来自近五万真实用户贡献的一百二十万张食品图像,经过严格清洗后保留一百万张高质量图片。随后,由专业标注团队进行首轮人工预标注,涵盖区域、食品名称、类别及份量等基础信息。在此基础上,利用GPT-4o与Qwen-max-latest等多模态模型进行自动化深度标注,生成包括成分、烹饪方法与热量在内的详细元数据。最终,由原活动用户执行二次人工评估与质量控制,逐项核对并修正模型输出,确保标注信息的精确性与可靠性,从而形成一套兼具规模与深度的多模态食品数据集。
特点
面向食品人工智能研究,数据集的特征设计需兼顾真实场景的复杂性与多维度分析需求。MM-Food-100K数据集以其丰富的多模态标注与高度的场景代表性脱颖而出。该数据集包含十万张食品图像,每张图像均配有结构化的JSON元数据,不仅涵盖菜肴名称与食品类型等基础分类信息,更深入提供了成分列表、预估份量重量、详细营养剖面、烹饪方法以及图像来源概率等关键字段。其食品类型分布均衡,涵盖自制食品、餐厅菜品、生鲜蔬果与包装食品等多种场景,且大部分图像具有较高的手机拍摄概率,贴近实际应用环境。这种将视觉信息与成分、重量、营养及烹饪方法等多层次语义相结合的标注体系,突破了传统数据集中单一图像分类的局限,为训练下一代高精度营养分析模型与健康管理应用提供了核心资源。
使用方法
在计算机视觉与健康信息学交叉领域,多模态食品数据集为诸多前沿应用提供了实验基础。MM-Food-100K数据集支持广泛的研发任务,用户可通过Hugging Face平台获取包含图像链接与结构化元数据的数据记录。对于食品识别与分类研究,该数据集可用于训练细粒度分类模型,实现从菜肴到成分的层级识别。在营养估算方面,研究者可结合图像识别结果与数据集提供的份量重量、营养剖面字段,开发精准的热量与营养素预测算法。此外,该数据集亦适用于智能食谱推荐系统的构建,通过分析图像中的食材信息生成个性化烹饪建议。在健康管理、餐厅自动化及计算机视觉基础研究等领域,其丰富的多模态标注可为模型训练与性能评估提供可靠基准,推动食品人工智能向实用化与精细化方向发展。
背景与挑战
背景概述
在人工智能与营养健康交叉领域,食物图像识别技术正成为实现个性化膳食管理的关键。由Codatta与Binance合作,通过Booster活动收集用户贡献数据,并于近期构建的MM-Food-100K数据集,旨在应对现有食物数据集在规模、多样性与注释深度上的不足。该数据集包含十万张高质量食物图像,并辅以成分、份量、营养及烹饪方法等多模态结构化注释,其核心研究问题聚焦于提升复杂现实场景下食物识别与营养分析的精准度,为智能食谱推荐与健康监测系统提供了重要的数据基础。
当前挑战
该数据集致力于解决食物智能分析领域的核心挑战,即如何从非结构化图像中精确推断多成分混合菜肴的营养构成与份量信息,此任务因食物外观的多样性与拍摄条件的不确定性而异常复杂。在构建过程中,团队面临数据质量控制的严峻考验,需从百万级用户生成图像中筛选高质量样本,并设计混合人机协同的标注流程以确保成分列表、重量估计及热量计算等细粒度注释的可靠性,同时平衡标注效率与准确性之间的矛盾。
常用场景
经典使用场景
在食品人工智能领域,MM-Food-100K数据集为食品识别与分类任务提供了经典的应用场景。该数据集凭借其十万张高质量食品图像及精细的多模态标注,成为训练深度神经网络模型的理想资源。研究者可基于此数据集开发能够准确识别全球多样化菜肴的视觉模型,尤其适用于处理家庭自制、餐厅菜品及包装食品等复杂现实场景。其丰富的标注信息,如食材列表、烹饪方法和营养概况,使得模型不仅能识别食品类别,还能深入理解其构成与属性,为后续的智能分析奠定坚实基础。
实际应用
在实际应用层面,MM-Food-100K数据集推动了多项智能健康与餐饮服务的发展。基于该数据集训练的模型可集成至移动健康应用程序中,实现通过拍照自动记录膳食并估算热量与营养成分,辅助个人健康管理。在餐饮行业,其支持智能餐厅系统与送餐机器人进行视觉识别,优化点餐与配送流程。此外,该数据集还能赋能智能食谱推荐系统,根据用户现有食材图片生成个性化烹饪建议,切实将学术研究成果转化为提升日常生活质量的实用工具。
衍生相关工作
围绕MM-Food-100K数据集,已衍生出一系列具有影响力的相关研究工作。其提供的多模态、细粒度标注结构,激励了研究者开发新型的端到端食品分析模型,这些模型能够联合处理图像识别、成分解析与营养估算任务。该数据集也常被用作基准,用于评估和比较不同神经网络架构在食品细分分类、跨域适应以及小样本学习上的性能。这些经典工作不仅深化了计算机视觉在食品领域的应用,也为构建更鲁棒、更实用的食品人工智能系统提供了重要的方法论参考。
以上内容由遇见数据集搜集并总结生成



