NutritionVerse-Real

Name: NutritionVerse-Real
Creator: 滑铁卢大学
Published: 2023-11-20 19:05:20
License: 暂无描述

arXiv2023-11-20 更新2024-06-21 收录

下载链接：

https://www.kaggle.com/datasets/nutritionverse/nutritionverse-real

下载链接

链接失效反馈

官方服务：

资源简介：

NutritionVerse-Real是由滑铁卢大学创建的一个开放访问的手动收集2D食品场景数据集，旨在用于膳食摄入量估计。该数据集包含889张图像，涵盖251种不同的菜肴和45种独特的食品类型。数据集的创建过程包括在现实生活中手动收集食品场景图像，使用食品秤测量每种成分的重量，并利用食品包装或加拿大营养文件中的营养信息计算每道菜的营养成分。通过人工标注图像生成分割掩码。该数据集主要应用于膳食感知领域的机器学习模型开发，以解决膳食摄入量估计中的偏差问题。

NutritionVerse-Real is an open-access manually collected 2D food scene dataset developed by the University of Waterloo, intended for dietary intake estimation. This dataset comprises 889 images, covering 251 distinct dishes and 45 unique food categories. The dataset construction workflow includes manually collecting food scene images in real-world settings, measuring the weight of each ingredient with food scales, and calculating the nutritional content of each dish using nutritional information from food packaging or Canadian nutrition documents. Segmentation masks are generated through manual image annotation. This dataset is primarily utilized for developing machine learning models in the field of dietary perception, aiming to mitigate bias issues in dietary intake estimation.

提供机构：

滑铁卢大学

创建时间：

2023-11-20

搜集汇总

数据集介绍

构建方式

在膳食摄入估计领域，传统方法常受主观偏差困扰，NutritionVerse-Real的构建旨在提供精准的基准数据。该数据集通过人工采集真实场景中的食物图像，使用iPhone 13 Pro Max从随机角度拍摄每道菜肴，共计收录251道独特菜品和45种食物类型的889张图像。每道菜肴的每种成分均经食物秤精确称重，营养成分数据源自食品包装或加拿大营养档案库，通过计算各成分营养值并累加获得整体膳食含量。随后，利用Roboflow平台对随机选取的部分图像进行人工标注，生成高质量的分割掩码，确保了数据在视觉与营养维度上的可靠性。

使用方法

该数据集适用于计算机视觉与机器学习驱动的膳食摄入估计研究，研究者可利用其图像与分割掩码训练食物识别、成分量化或体积估计模型。营养元数据允许直接关联视觉特征与热量、蛋白质等营养指标，助力开发端到端的膳食分析系统。在使用时，需注意数据中营养分布的偏差，建议采用鲁棒性算法或数据增强策略以提升模型泛化能力。数据集公开于Kaggle平台，支持学术与工业界加速膳食健康技术的探索与应用。

背景与挑战

背景概述

膳食摄入估计在理解个体与群体的营养习惯、预防及管理饮食相关健康问题中扮演关键角色。传统方法如食物频率问卷和24小时回顾存在显著偏差，促使研究者转向基于计算机视觉与机器学习的自动化解决方案。在此背景下，加拿大滑铁卢大学的研究团队于2022年推出了NutritionVerse-Real数据集，作为开放获取资源，旨在推动膳食感知领域的研究。该数据集包含889张真实食物场景图像，涵盖251道不同菜肴与45种食物类型，每张图像均配有精确测量的成分重量、分割掩码及营养成分元数据，其创建得到了加拿大国家研究委员会的支持。NutritionVerse-Real通过提供高质量、多模态的标注数据，为开发精准的膳食评估模型奠定了坚实基础，并对营养信息学与健康监测领域产生了积极影响。

当前挑战

NutritionVerse-Real数据集致力于解决膳食摄入估计中的核心挑战，即如何从二维食物图像中自动、准确地推断营养成分。这一任务面临诸多困难，例如食物外观因烹饪方式、光照条件与拍摄角度而异，同一食材在不同菜肴中可能呈现显著差异，且混合菜肴的成分识别与量化尤为复杂。在数据集构建过程中，研究人员需克服数据收集与标注的艰巨性：每道菜肴的成分重量需通过食物秤手动测量，营养成分数据需从包装或权威营养库中逐一提取，分割掩码则依赖人工精细标注，这些流程耗时且易引入人为误差。此外，数据分布呈现现实世界固有的不平衡性，如部分营养素值偏向较低范围，这要求模型具备处理数据偏斜的鲁棒性，以避免预测偏差，从而提升了算法设计的难度。

常用场景

经典使用场景

在营养学与计算机视觉交叉领域，NutritionVerse-Real数据集为膳食摄入估计研究提供了关键支持。其经典使用场景集中于训练和评估基于图像的自动膳食分析模型，通过包含889张真实食物场景图像、分割掩码及详细的营养成分元数据，使研究者能够开发算法以识别食物类型、量化食材重量并计算热量与营养素含量。该数据集模拟了现实世界中复杂的餐饮环境，为模型在多样化食物组合与拍摄角度下的性能验证奠定了坚实基础。

解决学术问题

该数据集有效应对了传统膳食评估方法中存在的记忆偏差与主观误差问题，为自动化营养分析提供了可靠的数据基准。通过精确测量每种食材的重量并关联官方营养数据库，NutritionVerse-Real解决了食物成分量化与营养值计算的学术挑战，支持研究者在计算机视觉模型中集成多模态数据以提高预测准确性。其公开可获取的特性亦促进了跨学科合作，推动了膳食感知领域标准化评估框架的发展。

实际应用

在实际应用层面，NutritionVerse-Real数据集为健康监测与个性化营养管理提供了技术依托。基于该数据集训练的模型可集成至移动应用程序或智能餐饮系统中，帮助用户通过拍摄食物照片即时获取营养信息，辅助慢性疾病患者或健身人群进行膳食规划。此外，该数据集支持公共卫生研究，通过大规模膳食模式分析为营养政策制定与健康教育提供数据驱动的见解。

数据集最近研究