UCLA Dining Hall Menus Dataset

github2024-04-10 更新2024-05-31 收录

下载链接：

https://github.com/lanqingwei/ucla-dining-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

从2016年7月25日至2017年4月10日从UCLA食堂网站下载的结构化菜单数据。该数据集包含早餐、午餐和晚餐的详细菜单信息，以JSON格式存储，分为v1和v2两个版本，每个版本详细记录了餐厅、厨房和食品项目的具体信息，包括营养成分和食品类型。

Structured menu data downloaded from the UCLA dining hall websites between July 25, 2016 and April 10, 2017. This dataset contains detailed menu information for breakfast, lunch, and dinner, stored in JSON format. It is divided into two versions, v1 and v2, with each version comprehensively recording specific details of restaurants, kitchens, and food items, including nutritional components and food types.

创建时间：

2017-04-11

原始信息汇总

UCLA Dining Hall Menus Dataset

数据集概述

该数据集包含从2016年7月25日至2017年4月10日从UCLA食堂网站下载的结构化菜单数据。

数据集结构

数据集位于data子目录中，分为v1和v2两个版本，具体结构如下：

顶层结构

数据集的顶层是一个包含三个元素的字典，结构如下： js { "b": [], // 早餐 "l": [], // 午餐 "d": [] // 晚餐 }

每个元素是一个包含每餐数据的数组。

餐次数组和餐厅字典

在餐次数组中，包含一系列餐厅字典，结构如下： js { "r": "...", // 餐厅名称 "rk": [] // 餐厅厨房 }

每个餐厅包含一个餐厅厨房数组，该数组包含一系列厨房字典。

厨房字典

厨房字典的结构如下： js { "k": "...", // 厨房名称 "i": [] // 厨房菜品 }

每个厨房包含一个厨房菜品数组，该数组包含一系列菜品字典。

菜品字典

每个菜品的结构如下： js { "e": "...", // 菜品名称 "t": "...", // 菜品类型 "n": [] // 营养信息 }

营养信息

营养信息数组的结构如下，数组索引（0-based）和营养信息类型在注释中： js [ "0", // 0, 总卡路里 "0", // 1, 脂肪卡路里

"0%", // 2, 维生素A "0%", // 3, 维生素C "0%", // 4, 钙 "0%", // 5, 铁

"0g", // 6, 总脂肪 "0%", // 7, 总脂肪百分比 "0g", // 8, 饱和脂肪 "0%", // 9, 饱和脂肪百分比 "0g", // 10, 反式脂肪

"0mg", // 11, 胆固醇 "0%", // 12, 胆固醇百分比 "0mg", // 13, 钠 "0%", // 14, 钠百分比

"0g", // 15, 总碳水化合物 "0%", // 16, 总碳水化合物百分比 "0g", // 17, 膳食纤维 "0%", // 18, 膳食纤维百分比 "0g", // 19, 糖

"0g" // 20, 蛋白质 ]

菜品类型信息

v1和v2版本在菜品类型信息上有所不同：

版本 `v1`

菜品类型信息是一个单字符字符串，表示菜品类型：

键字符串	类型信息
`o`	普通
`v`	素食
`g`	纯素食

版本 `v2`

菜品类型信息是一个字符串，包含以下字符：

键字符	信息
`v`	素食
`g`	纯素食
`p`	含花生
`t`	含树坚果
`w`	含小麦
`s`	含大豆
`d`	含乳制品
`e`	含鸡蛋
`l`	含贝类
`f`	含鱼类
`c`	低碳足迹

示例

菜品类型字符串 vde 表示该菜品是素食，并含有乳制品和鸡蛋。
菜品类型字符串 tc 表示该菜品是普通菜品，含有树坚果，并且是低碳足迹。

搜集汇总

数据集介绍

构建方式

UCLA Dining Hall Menus Dataset的构建基于从UCLA食堂网站下载的结构化菜单数据，时间跨度从2016年7月25日至2017年4月10日。该数据集分为两个版本，v1和v2，每个版本的数据结构略有不同，反映了UCLA食堂网站的更新情况。数据集的顶层结构包括早餐、午餐和晚餐三个主要部分，每个部分包含多个餐厅的详细菜单信息，包括餐厅名称、厨房名称、菜品名称及其营养信息。营养信息部分详细列出了每道菜的卡路里、脂肪、维生素、矿物质等成分，而类型信息则进一步区分了菜品的饮食类型，如素食、纯素食等。

特点

该数据集的一个显著特点是其详细的营养信息和多样化的饮食类型分类。每个菜品不仅提供了基础的营养成分，如卡路里和脂肪含量，还包括了维生素、矿物质等详细信息，这对于关注健康饮食的用户尤为重要。此外，数据集的类型信息在v2版本中得到了显著扩展，不仅区分了素食和纯素食，还增加了对过敏原和特殊饮食需求的标注，如是否含有乳制品、蛋类、海鲜等，这使得数据集在支持个性化饮食分析和规划方面具有很高的实用价值。

使用方法

使用UCLA Dining Hall Menus Dataset时，用户可以通过解析JSON格式的数据来获取详细的菜单和营养信息。Python内置的json.tool模块可以用于格式化和美化JSON数据，便于阅读和分析。数据集的结构化设计使得用户可以轻松提取特定餐厅、特定餐次或特定类型的菜品信息。此外，数据集的营养信息部分可以用于健康饮食分析，而类型信息则有助于个性化饮食规划，特别是对于有特殊饮食需求或过敏史的用户。

背景与挑战

背景概述

UCLA Dining Hall Menus Dataset是由UCLA的学生从2016年7月25日至2017年4月10日期间，从UCLA食堂网站下载的结构化菜单数据集。该数据集的创建旨在为研究人员和开发者提供一个详细的食堂菜单数据库，涵盖早餐、午餐和晚餐的详细信息，包括餐厅名称、厨房、菜品及其营养成分。该数据集的发布为食品营养分析、饮食习惯研究以及个性化饮食推荐等领域提供了宝贵的资源，推动了相关领域的研究进展。

当前挑战

UCLA Dining Hall Menus Dataset在构建过程中面临了数据结构复杂性和数据完整性的挑战。首先，数据集包含多个版本（v1和v2），每个版本的结构有所不同，这要求用户在处理数据时具备一定的技术能力以适应不同的数据格式。其次，数据集中的营养信息和菜品类型信息在不同版本中存在差异，特别是在v2版本中引入了更多关于菜品成分的详细信息，这增加了数据处理的复杂性。此外，数据的时间跨度有限，可能无法全面反映长期的饮食变化趋势，限制了其在长期研究中的应用。

常用场景

经典使用场景

UCLA Dining Hall Menus Dataset 的经典使用场景主要集中在餐饮管理和营养分析领域。研究者可以利用该数据集分析不同餐厅的菜单结构、食物种类及其营养成分，从而评估餐饮服务的多样性和健康性。此外，该数据集还可用于开发个性化饮食推荐系统，帮助用户根据个人营养需求选择合适的食物。

解决学术问题

该数据集解决了餐饮服务中的多个学术研究问题，如菜单多样性分析、营养成分的科学评估以及饮食习惯的个性化推荐。通过分析不同餐厅的菜单数据，研究者可以深入探讨餐饮服务的优化策略，并为营养学研究提供实证数据支持。其意义在于推动餐饮管理和营养科学的发展，提升公众的健康饮食意识。

衍生相关工作

基于 UCLA Dining Hall Menus Dataset，研究者已开展了多项相关工作，包括菜单多样性分析、营养成分的机器学习预测模型以及个性化饮食推荐系统。这些工作不仅推动了餐饮管理和营养科学的研究进展，还为智能餐饮服务的发展提供了技术支持。此外，该数据集还激发了更多关于健康饮食和可持续餐饮的研究，进一步拓展了其在学术和实际应用中的影响力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

UCLA Dining Hall Menus Dataset

UCLA Dining Hall Menus Dataset

数据集概述

数据集结构

顶层结构

餐次数组和餐厅字典

厨房字典

菜品字典

营养信息

菜品类型信息

版本 v1

版本 v2

示例

版本 `v1`

版本 `v2`