UCLA Dining Hall Menus Dataset

github2024-04-10 更新2024-05-31 收录

下载链接：

https://github.com/lqwdev/ucla-dining-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

从2016年7月25日至2017年4月10日从UCLA食堂网站下载的结构化菜单数据。数据集包含早餐、午餐和晚餐的详细信息，以JSON格式存储，分为v1和v2两个版本，详细记录了餐厅、厨房、菜品及其营养信息。

Structured menu data was downloaded from the UCLA dining hall website between July 25, 2016 and April 10, 2017. This dataset includes detailed information for breakfast, lunch, and dinner, is stored in JSON format, and is divided into two versions (v1 and v2). It comprehensively documents affiliated restaurants, kitchen facilities, specific dishes, and their corresponding nutritional details.

创建时间：

2017-04-11

原始信息汇总

UCLA Dining Hall Menus Dataset

数据集概述

时间范围：2016年7月25日至2017年4月10日
数据来源：UCLA食堂网站
数据格式：JSON

数据集结构

数据集包含在data子目录中，分为v1和v2两个版本，每个版本具有不同的结构。

顶层结构

数据集的顶层是一个包含三个元素的字典，分别表示早餐、午餐和晚餐： js { "b": [], // 早餐 "l": [], // 午餐 "d": [] // 晚餐 }

每个元素是一个包含各餐数据的数组。

餐次数组和餐厅字典

在餐次数组中，包含一系列餐厅字典，每个餐厅字典包含两个元素： js { "r": "...", // 餐厅名称 "rk": [] // 餐厅厨房 }

每个餐厅包含一个餐厅厨房数组，该数组包含一系列厨房字典。

厨房字典

厨房字典的结构如下： js { "k": "...", // 厨房名称 "i": [] // 厨房菜品 }

每个厨房包含一个厨房菜品数组，该数组包含一系列菜品字典。

菜品字典

每个菜品字典的结构如下： js { "e": "...", // 菜品名称 "t": "...", // 菜品类型 "n": [] // 营养信息 }

营养信息

营养信息数组的结构如下： js [ "0", // 总卡路里 "0", // 脂肪卡路里 "0%", // 维生素A "0%", // 维生素C "0%", // 钙 "0%", // 铁 "0g", // 总脂肪 "0%", // 总脂肪百分比 "0g", // 饱和脂肪 "0%", // 饱和脂肪百分比 "0g", // 反式脂肪 "0mg", // 胆固醇 "0%", // 胆固醇百分比 "0mg", // 钠 "0%", // 钠百分比 "0g", // 总碳水化合物 "0%", // 总碳水化合物百分比 "0g", // 膳食纤维 "0%", // 膳食纤维百分比 "0g", // 糖 "0g" // 蛋白质 ]

菜品类型信息

v1和v2版本在菜品类型信息上有所不同。

版本`v1`

菜品类型信息是一个单字符字符串，表示菜品类型：

键字符串	类型信息
`o`	普通
`v`	素食
`g`	纯素食

版本`v2`

菜品类型信息是一个字符串，包含以下字符：

键字符	信息
`v`	素食
`g`	纯素食
`p`	含花生
`t`	含树坚果
`w`	含小麦
`s`	含大豆
`d`	含乳制品
`e`	含鸡蛋
`l`	含贝类
`f`	含鱼
`c`	低碳足迹

示例

菜品类型字符串vde表示该菜品是素食，并含有乳制品和鸡蛋。
菜品类型字符串tc表示该菜品是普通菜品，含有树坚果，并且是低碳足迹。

搜集汇总

数据集介绍

构建方式

UCLA Dining Hall Menus Dataset的构建基于从UCLA食堂网站上抓取的结构化菜单数据，涵盖了2016年7月25日至2017年4月10日的时间段。数据集被分为两个版本（v1和v2），每个版本的结构根据UCLA食堂网站的更新而有所不同。数据集的核心结构包括早餐、午餐和晚餐的分类，每个分类下包含多个餐厅，餐厅内又细分为厨房，厨房中列出具体的菜品及其营养信息。这种层次化的结构设计使得数据集能够清晰地展示食堂菜单的多样性和复杂性。

特点

该数据集的显著特点在于其层次化的结构和详细的菜品信息。数据集不仅提供了菜品的名称和类型，还包含了丰富的营养信息，如热量、脂肪、维生素等，这为营养分析和饮食规划提供了宝贵的数据支持。此外，v2版本相较于v1版本，在菜品类型信息上进行了扩展，增加了对过敏原和低碳足迹的标注，使得数据集在食品安全和环保方面的应用更具潜力。

使用方法

使用UCLA Dining Hall Menus Dataset时，用户可以通过解析JSON格式的数据文件，利用Python内置的json.tool工具进行格式化处理，以提高可读性。数据集的层次化结构使得用户可以轻松地提取特定餐厅、厨房或菜品的详细信息。此外，用户可以根据需求选择不同版本的数据集，v2版本提供了更丰富的菜品类型信息，适用于需要更细致分析的应用场景。数据集的开放性和详细的营养信息使其在饮食研究、营养学分析和个性化饮食推荐等领域具有广泛的应用前景。

背景与挑战

背景概述

UCLA Dining Hall Menus Dataset是由加利福尼亚大学洛杉矶分校（UCLA）的研究人员从2016年7月25日至2017年4月10日期间，从UCLA食堂网站上收集的结构化菜单数据集。该数据集的创建旨在为研究餐饮服务、营养学以及食品选择行为等领域提供丰富的数据支持。通过详细记录每日的早餐、午餐和晚餐菜单，包括餐厅名称、厨房分类、菜品名称及其营养信息，该数据集为研究者提供了深入分析学生饮食习惯和营养摄入的宝贵资源。

当前挑战

UCLA Dining Hall Menus Dataset在构建过程中面临多项挑战。首先，数据结构的复杂性要求研究者对不同版本的菜单数据进行细致的分类和整理，尤其是不同版本之间的差异，如v1和v2版本在菜品类型信息上的不同。其次，营养信息的准确性和完整性是该数据集的关键挑战，确保每项菜品的营养成分数据精确无误，以便为营养学研究提供可靠依据。此外，数据的可扩展性也是一个重要问题，随着时间的推移，如何持续更新和维护数据集以保持其时效性和实用性，是未来需要解决的难题。

常用场景

经典使用场景

UCLA Dining Hall Menus Dataset的经典使用场景主要集中在营养学和饮食行为研究领域。研究者可以利用该数据集分析不同餐次的营养成分分布，评估特定饮食习惯对健康的影响，或探索不同餐厅和厨房的菜单多样性。此外，该数据集还可用于开发个性化饮食推荐系统，帮助用户根据营养需求选择合适的餐食。

实际应用

UCLA Dining Hall Menus Dataset在实际应用中具有广泛的潜力。餐饮行业可以利用该数据集优化菜单设计，确保营养均衡并满足不同顾客的需求。健康管理平台可以基于此数据集开发个性化饮食建议，帮助用户实现健康目标。此外，学校和公司食堂也可借鉴该数据集，提升餐饮服务的质量和多样性。

衍生相关工作

基于UCLA Dining Hall Menus Dataset，已衍生出多项经典工作。例如，研究者开发了基于营养成分的饮食推荐算法，帮助用户选择最符合其健康需求的餐食。此外，该数据集还被用于构建饮食行为模型，分析不同人群的饮食偏好和习惯。在公共卫生领域，该数据集也为慢性病预防和营养干预研究提供了重要支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

UCLA Dining Hall Menus Dataset

UCLA Dining Hall Menus Dataset

数据集概述

数据集结构

顶层结构

餐次数组和餐厅字典

厨房字典

菜品字典

营养信息

菜品类型信息

版本v1

版本v2

示例

版本`v1`

版本`v2`