five

MealRec

收藏
arXiv2022-05-24 更新2024-06-21 收录
下载链接:
https://github.com/WUT-IDEA/MealRec
下载链接
链接失效反馈
官方服务:
资源简介:
MealRec是一个专注于餐食推荐研究的数据集,由武汉理工大学创建。该数据集基于Allrecipes.com的用户评论记录,涵盖了1500多名用户、7200多个食谱和3800多个餐食。每个食谱包含丰富的信息,如成分、制作说明、图片等,每个餐食由开胃菜、主菜和甜点组成。MealRec的创建考虑了食谱类别的结构约束,以及餐食的显性和隐性特征的一致性。该数据集旨在解决餐食推荐领域的研究需求,通过提供高质量的基准数据集,促进相关研究的发展。

MealRec is a dataset dedicated to meal recommendation research, created by Wuhan University of Technology. It is constructed based on user review records from Allrecipes.com, covering over 1,500 users, more than 7,200 recipes and over 3,800 meal sets. Each recipe contains comprehensive information including ingredients, preparation instructions, images and more. Each meal set consists of an appetizer, a main course and a dessert. The development of MealRec takes into account the structural constraints of recipe categories, as well as the consistency between the explicit and implicit features of meal sets. This dataset aims to address the research demands in the field of meal recommendation, and promote the advancement of relevant studies by providing a high-quality benchmark dataset.
提供机构:
武汉理工大学
创建时间:
2022-05-24
搜集汇总
数据集介绍
main_image_url
构建方式
在餐饮推荐系统研究领域,高质量基准数据集的稀缺长期制约着相关算法的发展。为应对这一挑战,MealRec数据集从全球知名食谱分享平台Allrecipes.com系统性地采集了2000年至2018年间的用户评论记录。其构建过程首先对原始食谱与用户交互数据进行清洗与过滤,仅保留评分不低于4分(五分制)的正面反馈,并确保每位用户至少与5个食谱产生交互、每个食谱至少获得5次评论,以此保障数据的有效性与密度。随后,依据西餐标准的三道菜结构——即开胃菜、主菜与甜点——作为套餐的基本组成框架,通过算法将用户在一定时间段内偏好特征相似的食谱进行组合。该算法不仅要求套餐内的三道菜共享至少一个由创作者标注的显性标签(如烹饪风格),还确保它们被同一用户在相近时间内所喜爱,从而兼顾了套餐在显性与隐性特征上的一致性。最终,仅当用户喜爱套餐中的所有菜品时,才建立用户与套餐的交互记录,并进一步过滤交互次数过少的用户与套餐,形成了包含1,575名用户、3,817个套餐、7,280个食谱及46,767条用户-套餐交互的高质量结构化数据集。
特点
MealRec数据集的核心特点在于其专为套餐推荐任务设计的结构化表示与丰富的多模态信息。与通用的商品或音乐歌单推荐数据集不同,该数据集严格遵循餐饮领域的先验知识,每个套餐均由开胃菜、主菜和甜点三类菜品按固定结构组成,引入了重要的类别约束,这为研究类别感知的推荐模型提供了天然基础。数据集中的每个食谱均附有详尽的元数据,包括食材列表、烹饪步骤、图片链接、营养信息以及用户生成的标签,为跨模态检索、食物识别等延伸研究提供了可能。在数据规模与密度上,MealRec与真实世界的数据集(如Youshu)处于同一量级,且具有更高的用户-套餐交互密度,足以支持数据密集型模型的训练。此外,数据集中所有用户-套餐交互均源于真实的用户食谱偏好,并通过严谨的构建逻辑确保套餐的合理性与用户偏好的真实性,为算法评估提供了可靠且贴近实际场景的测试平台。
使用方法
MealRec数据集为餐饮推荐及相关领域的研究提供了标准化的评估基准。研究者可基于其提供的用户-套餐交互矩阵、食谱-套餐隶属关系以及丰富的食谱元数据,开发与评估各类套餐推荐算法。典型的使用范式包括:将数据集按用户划分为训练集、验证集与测试集,采用留一法等策略评估模型在Top-K推荐任务上的性能,常用指标包括HR@K和NDCG@K。数据集中清晰的结构化信息特别适合用于探索类别约束下的推荐模型,例如论文中提出的类别感知注意力模型(CCMR),该模型利用食谱、类别与用户之间的层次结构学习用户偏好。此外,该数据集还可应用于更广泛的研究场景,如结合食谱图片与文本描述的跨模态检索、基于食材与营养信息的健康饮食推荐,以及融合多模态特征的套餐生成等。数据及开源代码已公开,确保了研究的可复现性与可扩展性。
背景与挑战
背景概述
在推荐系统领域,捆绑推荐旨在为用户推荐一组作为整体考量的物品,已在电子商务、音乐播放列表等场景广泛应用。然而,餐饮业中的个性化餐食推荐研究却因缺乏高质量基准数据集而进展缓慢。为应对这一需求,武汉理工大学与南昆士兰大学的研究团队于2022年联合创建了MealRec数据集。该数据集源自Allrecipes.com的用户评论记录,涵盖逾1500名用户、7200余份食谱及3800多份餐食,每份餐食均由开胃菜、主菜和甜点构成。MealRec的发布填补了餐食推荐领域公开数据集的空白,为开发数据驱动的推荐模型提供了关键基础设施,有力推动了餐饮个性化服务的研究进程。
当前挑战
MealRec数据集致力于解决餐食捆绑推荐这一特定领域问题,其核心挑战在于如何建模用户对包含多道菜肴的完整餐食的复杂偏好,而非对单一菜肴的喜好。这要求算法不仅能理解菜肴间的搭配合理性,还需捕捉用户对餐食整体风味的综合评判。在数据集构建过程中,研究者面临两大主要挑战:一是如何从离散的用户-食谱交互记录中,合理构建具有逻辑一致性的多道式餐食,这需要同时考虑菜肴类别的结构约束与风味特征的显隐性一致性;二是如何基于用户对单个菜肴的评分,可靠地推断其对完整餐食的偏好,这涉及对用户容忍度的精准建模,确保构建的交互数据能真实反映用户对餐食整体的接纳程度。
常用场景
经典使用场景
在餐饮推荐系统研究中,MealRec数据集为个性化套餐推荐提供了基准测试平台。该数据集源自Allrecipe.com的用户评论记录,包含超过1,500名用户、7,200余份食谱及3,800多个套餐,每个套餐由开胃菜、主菜和甜点构成标准的三道菜式。研究者利用其丰富的结构化信息,如食材、烹饪步骤、图片及分类标签,开发并验证能够理解用户饮食偏好的智能推荐算法。
衍生相关工作
围绕MealRec数据集已衍生出多项创新研究,其中最具代表性的是论文提出的类别约束套餐推荐模型。该模型通过层次化注意力机制学习类别感知的用户偏好表示,在实验中显著优于传统捆绑推荐方法。后续研究进一步探索了基于图神经网络的套餐表征学习、多模态食谱检索等方向,形成了以该数据集为核心的技术演进脉络。
数据集最近研究
最新研究方向
在餐饮推荐系统领域,MealRec数据集的发布标志着个性化套餐推荐研究迈入新阶段。该数据集聚焦于构建包含前菜、主菜和甜点的完整套餐推荐,其独特的三道式结构为研究类别约束下的捆绑推荐提供了理想场景。前沿研究主要围绕基于图神经网络的跨类别偏好建模展开,通过捕捉用户、食谱与套餐间的复杂交互关系,提升推荐精准度。同时,结合注意力机制的层次化表示学习成为热点,旨在从用户历史交互中提取类别级偏好特征,以应对套餐内部食谱间的语义一致性挑战。该数据集不仅推动了健康饮食与个性化口味的平衡研究,也为多模态食谱检索、食物图像识别等交叉领域提供了基准平台,对智慧餐饮服务的发展具有重要实践意义。
相关研究论文
  • 1
    MealRec: A Meal Recommendation Dataset武汉理工大学 · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作