five

Eco-Amazon

收藏
arXiv2026-02-17 更新2026-02-19 收录
下载链接:
https://doi.org/10.5281/zenodo.18549130
下载链接
链接失效反馈
官方服务:
资源简介:
Eco-Amazon是由巴里大学和博洛尼亚大学联合创建的电子商务数据集,旨在通过产品碳足迹(PCF)元数据增强亚马逊三大类商品数据(家居厨房、服装和电子产品)。该数据集包含159条标注真实PCF值的商品记录,其碳排放数据利用大语言模型(LLM)通过零样本框架从产品属性自动估算生成。数据集构建过程融合了GHG Protocol和ISO 14040等国际标准,通过解析商品描述文本实现规模化PCF标注。该资源主要应用于可持续推荐系统领域,为开发环保导向的信息检索和商品推荐算法提供关键环境指标支持。
提供机构:
巴里大学·阿尔多莫罗; 博洛尼亚大学
创建时间:
2026-02-17
搜集汇总
数据集介绍
构建方式
在电子商务与可持续人工智能交叉领域,Eco-Amazon数据集的构建采用了创新的零样本大语言模型框架。该框架首先基于广泛使用的亚马逊评论数据集(涵盖电子产品、家居厨房和服装三大领域),通过k-core过滤与随机采样优化数据规模与质量。随后,利用精心设计的提示工程,引导大语言模型依据产品元数据与描述,遵循国际碳核算标准(如GHG协议与ISO 14040/14044),估算每个产品的全生命周期碳足迹值。这一过程完全依赖公开可得的文本信息,无需领域特定训练或专有数据,确保了方法的可扩展性与可复现性。最终,数据集在原始商品信息基础上,增补了由大语言模型生成的碳足迹估计值,为可持续信息检索与推荐研究提供了关键的环境影响信号。
使用方法
该数据集旨在支持下一代可持续信息检索与推荐系统的开发、基准测试与评估。研究者可直接使用其中增补的碳足迹数据,将其作为额外的特征信号,集成到推荐或排序模型中。一种典型应用是通过后处理重排序策略,将商品的碳足迹值作为权重因子,与模型预测的相关性分数相结合,从而在推荐列表中平衡准确性目标与环境可持续性目标。数据集附带的使用案例演示了如何实现这种权衡。此外,其提供的真实碳足迹子集可用于基准测试,评估不同碳足迹估算模型(包括其他大语言模型或混合方法)的排名一致性与数值准确性。通过这种方式,Eco-Amazon为探索多目标优化、可持续性感知的排名与多样化推荐等任务提供了坚实的基础。
背景与挑战
背景概述
在负责任与可持续人工智能的时代背景下,信息检索与推荐系统亟需超越传统精度指标,将环境可持续性纳入考量。然而,这一研究方向因标准基准中缺乏细粒度的产品环境影响数据而受到严重制约。为填补这一空白,由意大利巴里大学与博洛尼亚大学的研究团队于2026年共同推出了Eco-Amazon数据集。该资源基于三个广泛使用的亚马逊评论数据集(家居厨房、服装、电子产品),通过大语言模型的零样本推理框架,为产品元数据注入了产品碳足迹估算值。Eco-Amazon的发布标志着可持续推荐研究迈出了关键一步,为开发、评估新一代环保型检索与推荐模型提供了重要的数据基础,推动了信息检索、推荐系统与可持续人工智能的交叉领域发展。
当前挑战
Eco-Amazon数据集致力于解决可持续推荐系统中的核心挑战:如何在缺乏产品级碳足迹标注的情况下,构建能够引导用户选择环保商品的数据资源。其首要挑战在于准确估算大规模电子商务目录中产品的碳足迹,传统生命周期评估方法依赖专业数据库与人工映射,难以扩展至海量异构商品。尽管大语言模型为零样本估算提供了可能,但其在绝对数值精度上仍存在误差,尤其对高排放产品的估算偏差较大。此外,构建过程中需平衡数据规模与计算成本,通过采样与过滤确保数据可用性,同时保持估算流程的透明性与可复现性,以支持后续研究的比较与验证。
常用场景
经典使用场景
在电子商务与信息检索领域,Eco-Amazon数据集为可持续推荐系统的研究提供了关键支撑。该数据集通过对亚马逊三大核心品类(电子产品、家居厨房、服装)的商品进行产品碳足迹(PCF)标注,构建了一个融合环境信号的大规模基准资源。其最经典的应用场景在于支持可持续推荐算法的开发与评估,研究者可利用数据集中的PCF元数据,设计并测试能够在推荐列表中平衡用户偏好与碳减排目标的模型,例如通过后处理重排序策略,将低碳商品优先呈现给用户,从而在保证推荐准确性的同时引导环保消费行为。
解决学术问题
Eco-Amazon数据集主要解决了可持续人工智能研究中缺乏商品级环境影响力数据的瓶颈问题。传统推荐系统研究侧重于精度指标,而忽视了对环境影响因素的量化与整合,该数据集通过引入基于大语言模型的零样本PCF估计框架,为学术界提供了可复现、可扩展的环境元数据标注方案。其意义在于推动了信息检索与推荐系统研究范式的转变,使得模型评估能够纳入碳足迹等多维可持续性指标,促进了跨领域方法(如生命周期评估与机器学习)的融合,并为开发下一代兼顾性能与环保的智能系统奠定了数据基础。
实际应用
在实际应用层面,Eco-Amazon数据集能够赋能电子商务平台构建环境友好的商品推荐与服务。例如,平台可集成数据集中PCF估计值,为用户提供碳足迹标签或低碳筛选功能,增强消费决策的透明度。同时,企业可利用该数据集训练定制化的可持续推荐引擎,在个性化推荐流程中动态调整商品排序,优先展示低碳替代品,从而响应政策监管与消费者日益增长的环保诉求。此外,数据集还可用于供应链碳管理,辅助企业评估产品线的整体环境影响,优化绿色采购与生产策略。
数据集最近研究
最新研究方向
在可持续人工智能的浪潮下,电子商务领域的推荐系统研究正从传统准确性指标转向环境可持续性整合。Eco-Amazon数据集通过融合产品碳足迹(PCF)元数据,为这一前沿方向提供了关键资源。当前研究热点聚焦于利用大型语言模型(LLM)进行零样本PCF估计,以克服生命周期评估数据稀缺的瓶颈,并探索PCF感知的重新排序策略。这些工作推动了可持续检索与推荐模型的开发与基准测试,使系统能够在保持推荐性能的同时引导用户选择低碳产品,对促进绿色消费和降低数字服务环境足迹具有深远意义。
相关研究论文
  • 1
    Eco-Amazon: Enriching E-commerce Datasets with Product Carbon Footprint for Sustainable Recommendations巴里大学·阿尔多莫罗; 博洛尼亚大学 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作