five

USDA FoodData Central Foundation Foods dataset

收藏
github2026-03-19 更新2026-03-07 收录
下载链接:
https://github.com/hadley/foodbank
下载链接
链接失效反馈
官方服务:
资源简介:
foodbank提供了USDA FoodData Central Foundation Foods数据集,包含436种食物的营养成分、食用分量和食物类别等信息,并提供了六个相关的数据表,包括食物、食物营养成分、营养素定义、食物分量、计量单位和食物类别。

FoodBank provides the [USDA FoodData Central](https://fdc.nal.usda.gov/) Foundation Foods dataset as a data frame prepared for analysis in R. It includes nutritional composition values, serving sizes, and food categories for 436 food items.
创建时间:
2026-02-26
原始信息汇总

foodbank 数据集概述

数据集来源

  • 数据来源于美国农业部(USDA)的 FoodData Central 数据库中的 Foundation Foods 数据集(2025年12月发布)。该数据集中的食物营养素数值主要基于化学分析得出,并包含丰富的元数据。

数据集内容与规模

  • 该数据集以 R 语言中便于分析的数据框形式,提供了 436 种基础食物。
  • 数据包含营养素数值、份量大小和食物类别信息。

数据表结构

数据集包含六个相互关联的数据表,以 food 表为核心:

  1. food (食物表)

    • 包含 436 种基础食物的描述和类别信息。
    • 每样食物属于一个 food_category(通过 food_category_id = id 连接)。
    • 每样食物在 food_nutrient 表中有多行记录(通过 fdc_id 连接)。
    • 部分食物在 food_portion 表中有记录(通过 fdc_id 连接)。
  2. food_nutrient (食物营养素表)

    • 包含 19,828 条营养素数值记录(以每100克食物计)。
    • 每条记录关联一种 nutrient(通过 nutrient_id = id 连接)和一种 food(通过 fdc_id 连接)。
  3. nutrient (营养素定义表)

    • 包含 477 种营养素的名称和单位定义。
  4. food_portion (食物份量表)

    • 包含 187 种份量度量及其对应的克重。
    • 每条记录关联一个 measure_unit(通过 measure_unit_id = id 连接)。
  5. measure_unit (度量单位表)

    • 包含 123 种用于份量度量的单位。
  6. food_category (食物类别表)

    • 包含 28 个食物组类别。

数据用途与访问方式

  • 该数据集主要用于在 R 环境中进行食物与营养分析。
  • 除了作为 R 数据框使用外,也可通过提供的 Parquet 文件创建 DuckDB 数据库,以支持 SQL 查询或通过 dbplyr 进行操作。
搜集汇总
数据集介绍
构建方式
在营养学与食品科学领域,高质量的数据集对于研究膳食成分与健康关系至关重要。USDA FoodData Central Foundation Foods数据集由美国农业部系统构建,其核心数据来源于对436种基础食品的化学分析,确保了营养值的科学准确性。该数据集通过标准化流程整合了食品描述、类别及营养成分,并关联了营养物定义、份量单位等元数据,形成了一套结构化的关系型数据框架。数据以每100克食品为单位记录营养含量,同时涵盖份量测量信息,为营养评估提供了可靠的基础。
使用方法
研究人员可利用该数据集进行多样化的营养分析。通过R语言中的foodbank包,用户可以轻松加载数据,并借助dplyr等工具执行数据筛选、联接与聚合操作。例如,可以查询特定食品的详细营养成分,或筛选出蛋白质含量最高的食品列表。对于更复杂的分析需求,数据集支持导入DuckDB数据库,允许使用SQL进行灵活查询,或通过dbplyr接口进行编程式操作。这种多接口设计兼顾了便捷性与扩展性,使得从基础探索到深入建模的研究工作都能高效开展。
背景与挑战
背景概述
美国农业部食品数据中心基础食品数据集作为营养学与食品科学领域的重要资源,其创建源于对精确食品成分数据日益增长的需求。该数据集由美国农业部农业研究服务局主导维护,自2025年12月发布以来,整合了436种基础食品的详细营养信息。其核心研究问题聚焦于提供经过化学分析验证的高质量营养数据,以支持膳食评估、营养政策制定及公共卫生研究。该数据集通过结构化表格呈现食品类别、营养成分及份量单位,为科研人员与健康专业人士提供了可靠的数据基础,显著提升了营养学研究的准确性与可重复性。
当前挑战
在营养信息标准化领域,该数据集致力于解决食品成分数据不一致与来源模糊的长期挑战。具体而言,如何确保不同食品间营养值的可比性,以及整合多样化的测量单位与营养定义,构成了核心难题。在构建过程中,研究人员面临数据采集与验证的复杂性,包括化学分析方法的标准化、食品样本的代表性选择,以及大规模营养数据的高效清洗与结构化。此外,保持数据与不断更新的营养学知识同步,并实现跨平台的数据可访问性,亦是持续的技术挑战。
常用场景
经典使用场景
在营养学与食品科学领域,USDA FoodData Central Foundation Foods数据集为研究人员提供了基于化学分析的精确营养成分数据。该数据集常被用于构建食物营养数据库,支持膳食评估模型的开发,例如通过R语言环境下的foodbank包,用户能够便捷地查询特定食物如鹰嘴豆泥的营养成分,或筛选高蛋白食物列表,从而为营养干预研究提供数据支撑。
解决学术问题
该数据集解决了营养研究中食物成分数据标准化与可及性的关键问题。通过提供436种基础食物的详细营养信息,包括19,828条营养素记录,研究人员能够准确分析膳食模式与健康结局的关联,避免了以往依赖估算数据带来的偏差。其化学分析来源确保了数据的可靠性,为肥胖、慢性病等公共健康问题的机制探究奠定了实证基础。
实际应用
在实际应用中,该数据集被整合进膳食跟踪应用程序与临床营养管理工具,帮助用户个性化监控营养摄入。食品工业界则利用这些数据优化产品配方,以满足特定营养标准,例如开发低钠或高蛋白食品。公共卫生机构可借助数据集制定膳食指南,推动人群营养改善策略的实施。
数据集最近研究
最新研究方向
在营养学与食品科学领域,USDA FoodData Central Foundation Foods数据集作为权威的营养成分基准,正推动精准营养与个性化膳食研究的深入发展。当前研究聚焦于利用该数据集的高质量化学分析数据,结合机器学习算法构建食物营养图谱,以支持慢性病预防与健康管理策略的制定。热点方向包括整合多组学数据探索营养素与代谢健康的关联,以及开发智能膳食推荐系统,这些进展对公共卫生政策制定和食品工业创新具有重要参考价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作