Yueha0/FoodDialogues

Name: Yueha0/FoodDialogues
Creator: Yueha0
Published: 2024-06-18 09:43:18
License: 暂无描述

Hugging Face2024-06-18 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/Yueha0/FoodDialogues

下载链接

链接失效反馈

官方服务：

资源简介：

FoodDialogues数据集基于Nutrition5k数据集构建，包含了食材标签和精确的营养信息，适用于多种对话主题。数据集通过向GPT-4发送食材列表和营养信息，生成多轮对话，涵盖营养、卡路里计算、健康与疾病、新陈代谢、饮食计划、过敏、食物搭配和替代等主题。数据集中的对话存储在`FoodDialogues_train.json`和`FoodDialogues_test.json`文件中，而RGB图像和提取的角度帧存储在`images`文件夹中。

提供机构：

Yueha0

原始信息汇总

FoodDialogues 数据集概述

数据来源

基于 Nutrition5k 数据集构建。
包含食材标签和精确的营养信息。

数据内容

训练和测试数据分别存储在 FoodDialogues_train.json 和 FoodDialogues_test.json 文件中。
每个样本包含一个俯视RGB图像和一个特定角度的视频帧（角度A或D）。
图像存储在 images 文件夹中，需合并 images.tar.gz.001、images.tar.gz.002 和 images.tar.gz.003 文件后解压访问。

数据用途

用于生成多轮对话，涵盖营养、卡路里计算、健康与疾病、代谢、饮食计划、过敏、食物搭配和替代等话题。
对话生成过程涉及将食材列表和营养信息发送至 GPT-4 进行处理。

相关资源

更多详细信息请参考论文 FoodLMM。
数据处理代码详见 GitHub 代码库。

搜集汇总

数据集介绍

构建方式

在食品与营养信息处理领域，FoodDialogues数据集的构建体现了跨模态数据融合的前沿思路。该数据集以Nutrition5k为基础，精选了每个样本的俯视RGB图像及特定角度的视频帧，确保了视觉信息的丰富性与一致性。随后，将食材清单与详细营养数据以纯文本形式输入GPT-4模型，引导其围绕营养学、热量计算、健康管理及饮食规划等多个主题生成多轮对话，从而构建出兼具视觉与文本交互特性的高质量语料。

特点

FoodDialogues的独特之处在于其深度融合了视觉与对话数据，为食品领域的多模态研究提供了宝贵资源。数据集不仅包含精确的营养成分标注与食材信息，还通过GPT-4生成了涵盖健康、疾病、代谢等多维话题的自然对话，极大地拓展了应用场景。其训练与测试划分遵循原始数据集标准，保证了评估的严谨性，而图像与文本的配对设计则支持从视觉识别到语义理解的一系列任务。

使用方法

使用FoodDialogues时，用户需首先解压并合并分卷存储的图像压缩文件，以获取完整的视觉数据。对话内容以JSON格式提供，可直接加载并进行文本分析或对话系统训练。数据集适用于食品视觉问答、营养咨询对话生成及多模态学习等任务，研究者可结合图像与对话数据，开发能够理解食品属性并进行自然交互的智能系统。

背景与挑战

背景概述

在食品计算与营养学交叉领域，随着多模态大语言模型的兴起，构建能够支持复杂对话的食品相关数据集成为研究热点。FoodDialogues数据集由Yuehao Yin等人于2023年基于Nutrition5k数据集构建，其核心研究问题在于生成围绕食品成分、营养信息及健康话题的多轮对话数据，以推动食品领域对话系统的智能化发展。该数据集通过整合精确的营养标注与视觉信息，为营养咨询、膳食规划及健康管理等应用提供了独特的数据基础，显著促进了食品人工智能在交互式场景中的研究进展。

当前挑战

FoodDialogues数据集旨在解决食品领域多模态对话生成的挑战，包括如何准确结合营养学知识与视觉信息以生成连贯、专业的对话内容。在构建过程中，研究人员面临多重困难：首先，从Nutrition5k数据中提取并融合食材列表与详细营养信息需要高精度处理，以确保数据的一致性与可靠性；其次，利用GPT-4生成多主题对话时，需精心设计提示以覆盖营养、疾病、过敏等多样化话题，同时避免生成偏差或错误信息；此外，整合俯视RGB图像与特定角度视频帧涉及复杂的视觉数据对齐与预处理步骤，增加了数据集的构建复杂度。

常用场景

经典使用场景

在食品计算与营养学领域，FoodDialogues数据集以其独特的对话结构，为多模态大语言模型提供了丰富的训练素材。该数据集通过结合Nutrition5k的食材标签与营养信息，并借助GPT-4生成涵盖营养、热量计算、健康疾病、代谢、饮食规划、过敏、食物搭配与替代等多主题的对话，使得模型能够在视觉与文本交互中深入理解食物属性。这一经典场景常用于训练模型进行智能营养咨询，模拟真实饮食对话，提升模型在食品相关问答中的准确性与实用性。

衍生相关工作

围绕FoodDialogues数据集，衍生了一系列经典研究工作，其中最具代表性的是其源论文FoodLMM所提出的多模态大语言模型框架。该工作利用数据集中的对话与图像，训练模型实现食物识别、营养对话生成及饮食规划等任务，为食品人工智能设立了新基准。此外，后续研究在此基础上扩展了跨语言营养对话生成、低资源食物对话适应等方向，进一步丰富了食品计算的研究生态，推动了健康导向的人工智能技术发展。

数据集最近研究