five

madroid/nutrient5k-test-100

收藏
Hugging Face2024-07-11 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/madroid/nutrient5k-test-100
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含关于食物的详细信息,包括食物的名称、实际营养成分(如卡路里、脂肪、碳水化合物、蛋白质等)、食物来源和详细描述。数据集还包含食物的图像信息。数据集被分为两个部分:overhead和angle30,每个部分包含100个示例,分别占用41432293字节和30224496字节的存储空间。

This dataset contains detailed information about food, including the name of the food, actual nutritional content (such as calories, fat, carbohydrates, protein, etc.), the source of the food, and detailed descriptions. The dataset also includes image information of the food. The dataset is divided into two parts: overhead and angle30, each containing 100 examples and occupying 41432293 bytes and 30224496 bytes of storage space, respectively.
提供机构:
madroid
原始信息汇总

数据集概述

数据集信息

特征

  • name:
    • 类型: string
  • actual:
    • total:
      • calories:
        • 类型: float64
      • size:
        • 类型: float64
      • fat:
        • 类型: float64
      • carbs:
        • 类型: float64
      • protein:
        • 类型: float64
      • food_num:
        • 类型: int64
      • from:
        • 类型: string
      • detail:
        • 类型: string
    • foods:
      • id:
        • 类型: string
      • name:
        • 类型: string
      • size:
        • 类型: float64
      • calories:
        • 类型: float64
      • fat:
        • 类型: float64
      • carbs:
        • 类型: float64
      • protein:
        • 类型: float64
  • image:
    • 类型: image

数据分割

  • overhead:
    • 字节数: 41432293.0
    • 样本数: 100
  • angle30:
    • 字节数: 30224496.0
    • 样本数: 100

数据集大小

  • 下载大小: 71593585
  • 数据集大小: 71656789.0

配置

  • config_name: default
    • data_files:
      • split: overhead
        • path: data/overhead-*
      • split: angle30
        • path: data/angle30-*
搜集汇总
数据集介绍
main_image_url
构建方式
在营养信息识别领域,数据集的构建需兼顾视觉与结构化信息的融合。Nutrient5K-test-100数据集通过采集真实餐饮场景下的图像,并辅以精确的营养成分标注而形成。其构建过程涉及从多个来源(如专业营养数据库)提取食物成分数据,确保每张图像对应详细的营养参数,包括热量、脂肪、碳水化合物和蛋白质等。数据以两种视角(俯视和30度角)进行组织,增强了模型在不同观察角度下的泛化能力。
特点
该数据集的核心特点在于其多维度的结构化标注体系。除了提供整体餐食的营养汇总,还细致分解了每道菜肴的独立成分,形成层次化的营养信息网络。图像数据以高分辨率呈现,覆盖不同拍摄角度,为视觉模型提供了丰富的空间信息。标注字段不仅包含宏观营养指标,还融入了食物来源与细节描述,使得数据集在营养分析与计算机视觉交叉研究中具备独特价值。
使用方法
在应用层面,该数据集适用于营养评估模型的训练与验证。研究者可基于图像数据开发自动营养识别算法,利用结构化标注进行端到端的多任务学习。数据集的双视角设计支持视角不变性研究,而细致的成分分解便于探究食物组合的营养效应。使用时应遵循标准机器学习流程,注意划分训练集与测试集,并充分利用其丰富的元数据字段以提升模型解释性。
背景与挑战
背景概述
在营养信息学与计算机视觉交叉领域,精准的食物营养估算一直是推动健康监测与饮食管理智能化发展的核心议题。Nutrient5K-test-100数据集由madroid团队构建,作为Nutrient5K基准的测试子集,专注于通过多视角图像分析实现食物成分的自动量化。该数据集收录了100个样本,每个样本均包含俯视与30度倾斜角度的图像,并标注了热量、脂肪、碳水化合物、蛋白质等详细营养成分,旨在为机器学习模型提供标准化的评估框架,以解决从视觉信息推断营养价值的复杂问题,对促进个性化营养推荐系统与公共卫生研究具有显著影响力。
当前挑战
该数据集致力于应对食物营养估算领域的双重挑战:在领域问题层面,模型需克服食物外观的多样性、光照条件变化、遮挡以及混合餐盘中的成分分离等难题,以实现从图像到营养成分的高精度映射;在构建过程中,挑战集中于数据采集的标准化,包括多角度图像同步获取的协调、营养成分标签的权威性与一致性验证,以及确保数据在规模有限条件下仍能涵盖广泛的食物类别与烹饪方式,从而支撑模型的泛化能力与鲁棒性评估。
常用场景
经典使用场景
在计算机视觉与营养学交叉领域,Nutrient5K-test-100数据集为食物图像识别与营养成分分析提供了基准测试平台。该数据集通过包含俯视与30度角拍摄的食物图像,并标注详细的营养成分数据,支持研究者开发能够从视觉信息中自动估算热量、脂肪、碳水化合物及蛋白质含量的算法。其经典应用场景聚焦于训练和评估深度学习模型,以实现对复杂食物组合的精准成分解析,为自动化膳食评估奠定数据基础。
实际应用
在实际应用中,该数据集支撑了智能健康管理系统的开发。基于其构建的模型可集成于移动应用,允许用户通过拍摄餐盘照片自动获取营养分析,辅助个人膳食规划与慢性病管理。此外,在餐饮服务与食品工业中,该技术能用于菜品营养标签自动生成、食堂餐品营养监控,提升公共卫生领域的营养干预效率与精准度。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。例如,基于多视角融合的神经网络架构被提出以提升成分预测稳定性;同时,结合注意力机制的食物区域分割方法改善了复杂餐盘的分析精度。这些工作进一步推动了细粒度食物识别、跨视角特征学习等方向的发展,并为后续大规模营养图像数据集(如Nutrition5k完整版)的构建提供了方法论参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作