five

HC-85/food-nutritional-values

收藏
Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/HC-85/food-nutritional-values
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为常见食品的营养价值,包含两个配置:hidden_vector_states和raw。hidden_vector_states配置包含输入ID、注意力掩码和多个头部特征,而raw配置包含食品名称、份量、卡路里、脂肪、胆固醇、钠、维生素、矿物质、蛋白质、氨基酸、碳水化合物、纤维、糖、脂肪类型、酒精、灰分、咖啡因、可可碱和水分等特征。数据集最初由Aleksandr Antonov从Nutrition Value网站抓取,并发布在Kaggle上。

该数据集名为常见食品的营养价值,包含两个配置:hidden_vector_states和raw。hidden_vector_states配置包含输入ID、注意力掩码和多个头部特征,而raw配置包含食品名称、份量、卡路里、脂肪、胆固醇、钠、维生素、矿物质、蛋白质、氨基酸、碳水化合物、纤维、糖、脂肪类型、酒精、灰分、咖啡因、可可碱和水分等特征。数据集最初由Aleksandr Antonov从Nutrition Value网站抓取,并发布在Kaggle上。
提供机构:
HC-85
原始信息汇总

数据集概述

基本信息

  • 名称: Nutritional Values for Common Foods
  • 大小: 1K<n<10K
  • 语言: 英语

数据集配置

  • 配置名称: hidden_vector_states

    • 特征:
      • input_ids: int32序列
      • attention_mask: int8序列
      • head_0 至 head_11: float64序列
    • 训练集:
      • 示例数量: 8789
      • 数据大小: 670987416字节
      • 下载大小: 532067190字节
  • 配置名称: raw

    • 特征:
      • name: 字符串
      • serving_size: 字符串
      • calories: int64
      • 其他营养成分: 字符串
    • 训练集:
      • 示例数量: 8789
      • 数据大小: 6625607字节
      • 下载大小: 2002446字节

数据集标签

  • food
  • nutrition

数据来源

  • 原始数据由Aleksandr Antonov从Nutrition Value网站抓取,并在Kaggle上发布为"Nutritional values for common foods and products"。
搜集汇总
数据集介绍
main_image_url
构建方式
HC-85/food-nutritional-values数据集的构建,是通过网络爬虫技术从Nutrition Value网站上抓取常见食物的营养价值信息。该数据集包含食物名称、营养成分及含量等多种特征,并以训练集的形式呈现,共计8789个样本,数据格式包括字符串和整数类型。
特点
本数据集的特点在于其详尽地记录了各类食物的营养成分,涵盖了从卡路里、脂肪含量到各类维生素和矿物质等共数十种营养指标。此外,数据集的构建注重数据的真实性和完整性,适用于食品营养学相关的研究与应用。
使用方法
使用该数据集时,用户可以根据具体的研究需求,选择相应的配置文件,如hidden_vector_states或raw。其中,hidden_vector_states配置提供了深度的特征表示,而raw配置则包含了原始的营养价值数据。用户可通过HuggingFace提供的工具直接加载数据集,并根据需要进行数据清洗、转换和分析操作。
背景与挑战
背景概述
HC-85/food-nutritional-values数据集,亦称为Nutritional Values for Common Foods,是一个关于常见食物营养价值的数据库。该数据集由Aleksandr Antonov于营养值网站NutritionValue.org上抓取,并在Kaggle平台上发布。该数据集的创建旨在为研究人员和公众提供一份详尽的食物营养成分清单,以促进营养学研究和日常饮食健康管理。其包含的信息涵盖卡路里、脂肪、胆固醇、钠、维生素、矿物质等多种营养成分,对营养学、健康科技以及公共卫生产生了显著影响。
当前挑战
在研究背景方面,HC-85/food-nutritional-values数据集所面临的挑战主要在于确保数据的准确性与完整性,以及从非结构化数据中提取和转换信息的过程。具体挑战包括:1) 数据集在构建过程中需要处理大量的异构数据源,并将之标准化以适应研究需求;2) 食物营养成分的测量存在变异性,如何整合和统一这些数据是一个难点;3) 数据集在解决食物营养成分分析领域问题时,如何保持数据的时效性和反映最新的营养学研究成果。
常用场景
经典使用场景
在食品科学与营养研究领域,HC-85/food-nutritional-values数据集被广泛用于构建营养价值的预测模型。该数据集详细记录了常见食品的营养成分,为研究人员提供了一个全面且细致的资源,以便于进行食品成分的量化分析。
解决学术问题
该数据集解决了学术研究中关于食品营养信息不完整或不准确的问题。通过提供标准化和结构化的食品营养成分数据,它促进了营养学领域的学术研究,为健康饮食的推广和慢性病的预防提供了科学依据。
衍生相关工作
基于HC-85/food-nutritional-values数据集,研究者们衍生出了一系列相关工作,如营养价值的可视化工具、食品营养成分的关联性分析,以及针对特定人群的营养干预研究。这些工作进一步扩展了数据集的应用范围,加深了我们对食品营养价值的理解。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作