RecipeEmission
收藏arXiv2025-03-21 更新2025-03-25 收录
下载链接:
https://github.com/RaoulKalisvaart/green-recommender-systems
下载链接
链接失效反馈官方服务:
资源简介:
RecipeEmission数据集是由代尔夫特理工大学构建的首个包含碳足迹排放特征的商品推荐系统数据集,包含32,093名用户和5,605个食谱项目,以及247,521个用户与食谱间的交互信息。每个项目(食谱)都有其对应的CO2-eq足迹和绿色程度评分。该数据集旨在推动环境友好的推荐系统研究,特别是关注那些能够推荐更低碳排放食谱的算法。
RecipeEmission Dataset is the first commodity recommendation system dataset integrated with carbon footprint emission characteristics, developed by Delft University of Technology. It comprises 32,093 users, 5,605 recipe items, and 247,521 user-recipe interaction records. Each recipe item is accompanied by its corresponding CO₂-equivalent (CO₂-eq) footprint and greenness score. This dataset aims to advance research on environmentally friendly recommendation systems, particularly algorithms focused on recommending low-carbon footprint recipes.
提供机构:
代尔夫特理工大学
创建时间:
2025-03-21
搜集汇总
数据集介绍

构建方式
RecipeEmission数据集的构建过程基于Food.com原始数据集,通过添加食谱的碳足迹和绿色度评分来增强其可持续性特征。构建过程包括五个关键步骤:数据预过滤、成分量化、碳足迹量化、质量评估以及绿色度转换。预过滤阶段移除了交互较少的用户和食谱,确保数据集的稀疏性与传统推荐系统数据集相当。成分量化阶段通过爬取和标准化食材数量,解决了原始数据中缺失的量化信息问题。碳足迹量化阶段利用在线API和文献检索,为每道食谱的食材计算其二氧化碳当量(CO2-eq)。质量评估阶段通过人工检查确保数据的准确性,最终将CO2-eq转换为0-5的绿色度评分,以匹配用户评分的区间范围。
特点
RecipeEmission数据集包含32,093名用户、5,605道食谱及247,521条交互记录,稀疏性高达99.86%。每道食谱不仅包含用户评分和评论,还标注了其CO2-eq碳足迹及绿色度评分。该数据集的特点在于其长尾分布与用户行为模式与传统推荐系统数据集相似,但首次引入了环境可持续性维度。食谱的碳足迹分布呈现长尾特征,多数食谱的碳足迹较低,而高碳足迹食谱通常与肉类等食材相关。此外,用户评分与食谱绿色度之间无明显相关性,表明用户偏好未显著受环境影响。
使用方法
RecipeEmission数据集适用于研究推荐系统在平衡推荐准确性与环境可持续性方面的潜力。使用方法包括:1)基准测试:评估传统推荐算法(如协同过滤、矩阵分解)在推荐绿色食谱时的表现;2)绿色度优化:通过重新排序策略(如基于绿色度与预测评分的加权效用函数)调整推荐列表,以提升绿色度;3)多目标分析:结合多样性、新颖性等指标,探索推荐系统的综合性能。数据集支持离线实验,可通过划分训练集、验证集和测试集,验证算法在推荐绿色选择上的有效性。
背景与挑战
背景概述
RecipeEmission数据集由荷兰代尔夫特理工大学的Raoul Kalisvaart、Masoud Mansoury、Alan Hanjalic和Elvin Isufi等研究人员于2025年提出,旨在解决推荐系统领域在促进可持续消费选择方面的研究空白。该数据集聚焦电子商务领域,特别关注食谱推荐场景,首次将碳排放足迹作为物品特征纳入推荐系统数据集。其核心创新在于通过量化食谱配料的二氧化碳当量(CO2-eq),为研究推荐算法如何平衡推荐准确性与环保属性提供了实证基础。该工作开创性地构建了推荐系统与环境可持续性交叉研究的新范式,对推动绿色计算和可持续消费具有重要学术价值。
当前挑战
RecipeEmission数据集面临双重挑战:在领域问题层面,需解决推荐系统长期忽视物品环境属性的问题,传统算法仅优化准确性而忽略绿色指标,导致无法引导可持续消费;在构建技术层面,存在数据稀疏性高(原始数据稀疏度达99.998%)、配料数量信息缺失、非标准化计量单位转换复杂、碳排放数据来源分散且缺乏统一标准等难题。特别地,精确量化食材碳足迹涉及生产地域、运输距离和季节变化等动态因素,需通过启发式规则和人工标注进行数据补全,最终仅能实现92%的标注准确率。
常用场景
经典使用场景
在电子商务和食品推荐领域,RecipeEmission数据集被广泛应用于研究推荐系统如何促进可持续消费选择。该数据集包含食谱及其碳足迹信息,使得研究者能够评估和优化推荐算法在推荐低碳排放食谱方面的表现。通过分析用户与食谱的交互数据,研究者可以探索如何在满足用户偏好的同时,减少推荐系统的环境足迹。
实际应用
在实际应用中,RecipeEmission数据集可以用于开发碳足迹感知的推荐系统,帮助电子商务平台和食品服务提供商推荐更环保的产品和食谱。例如,食品配送服务可以使用该数据集优化其推荐算法,优先推荐低碳排放的食谱,从而减少整体供应链的碳足迹。此外,该数据集还可用于政策制定者评估和推动可持续消费行为。
衍生相关工作
RecipeEmission数据集衍生了多项经典研究,包括碳足迹感知推荐算法的开发、多目标优化方法在推荐系统中的应用,以及用户行为与可持续消费之间关系的研究。例如,一些研究利用该数据集提出了基于重新排序的策略,以在不显著牺牲推荐准确性的情况下提高推荐的绿色程度。此外,该数据集还被用于探索深度学习模型在绿色推荐系统中的表现。
以上内容由遇见数据集搜集并总结生成



