Detego Shopping Basket Dataset
收藏github2021-02-01 更新2024-05-31 收录
下载链接:
https://github.com/detegods/shopping_basket_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含约50万条来自20家零售时尚商店的购物篮数据,这些数据收集自2016年11月至2018年12月,涵盖四个不同城市的销售情况。数据集csv文件包含交易标识、产品标识、销售日期和销售城市等字段。
This dataset comprises approximately 500,000 shopping basket records from 20 retail fashion stores, collected from November 2016 to December 2018, covering sales data from four different cities. The dataset's CSV file includes fields such as transaction ID, product ID, sale date, and sale city.
创建时间:
2019-03-20
原始信息汇总
Detego Shopping Basket Dataset 概述
数据集基本信息
- 数据量:约50万条购物篮数据
- 来源:20家零售时尚店铺
- 地理位置:分布于四个不同城市
- 数据收集时间:2016年11月至2018年12月
数据集内容
- TransactionId:交易标识符,用于分组生成购物篮
- ProductId:产品标识符(匿名产品编号)
- Date:产品销售日期
- City:产品销售城市(匿名)
引用信息
- 参考文献:M. Wölbitsch, S. Walk, M. Goller, and D. Helic (2019) Beggars Can’t Be Choosers: Augmenting Sparse Data for Embedding-Based Product Recommendations in Retail Stores. In Proceedings of 27th ACM International Conference on User Modelling, Adaptation and Personalization (UMAP’19)
搜集汇总
数据集介绍

构建方式
Detego Shopping Basket Dataset的构建基于2016年11月至2018年12月期间,从位于四个不同城市的20家零售时尚商店收集的约50万笔购物篮数据。每笔交易数据通过匿名化处理,确保了用户隐私的保护。数据集中的每条记录包含交易ID、产品ID、销售日期以及销售城市等关键字段,这些字段为后续的数据分析和模型训练提供了丰富的信息基础。
特点
该数据集的特点在于其广泛的覆盖范围和详细的数据结构。它不仅涵盖了多个城市和商店的销售数据,还通过匿名化的产品ID和交易ID,确保了数据的多样性和隐私性。此外,数据集的时间跨度长达两年,为研究季节性购物行为和长期消费趋势提供了宝贵的数据支持。
使用方法
使用Detego Shopping Basket Dataset时,研究者可以通过交易ID将数据分组,形成购物篮,进而分析消费者的购买模式和偏好。产品ID和销售日期的结合,使得时间序列分析和产品推荐系统的开发成为可能。此外,销售城市的数据可用于地域性市场分析,帮助零售商优化库存和营销策略。在使用该数据集时,需引用相关文献以尊重数据提供者的知识产权。
背景与挑战
背景概述
Detego购物篮数据集由20家零售时尚商店的约50万笔购物篮数据组成,这些商店分布在四个不同的城市。数据收集时间跨度为2016年11月至2018年12月。该数据集由M. Wölbitsch、S. Walk、M. Goller和D. Helic等研究人员创建,并于2019年在第27届ACM国际用户建模、适应和个性化会议(UMAP’19)上发布。该数据集的核心研究问题在于如何通过增强稀疏数据来改进基于嵌入的产品推荐系统,特别是在零售商店中的应用。这一研究对零售行业的个性化推荐系统具有重要的推动作用,为理解消费者购物行为提供了宝贵的数据支持。
当前挑战
Detego购物篮数据集在解决零售行业产品推荐问题时面临多重挑战。首先,由于数据来源于多个城市的零售商店,数据的地理分布和消费者行为的多样性增加了分析的复杂性。其次,数据集中的产品标识符被匿名化处理,这虽然保护了隐私,但也限制了产品具体信息的获取,增加了推荐算法的设计难度。此外,数据的时间跨度较长,如何有效处理时间序列数据并捕捉消费者行为的动态变化也是一个重要挑战。在数据构建过程中,研究人员还需应对数据稀疏性问题,即如何在有限的交易数据中提取出有意义的模式,以支持精准的推荐系统。这些挑战共同构成了该数据集在应用和研究中的主要难点。
常用场景
经典使用场景
Detego Shopping Basket Dataset 数据集在零售和消费者行为分析领域具有广泛的应用。该数据集包含了来自四个不同城市的20家零售时尚商店的约50万笔购物篮数据,时间跨度为2016年11月至2018年12月。研究者通常利用该数据集进行购物篮分析,探索消费者购买模式、产品关联规则以及跨城市的消费行为差异。通过分析这些数据,可以揭示不同地区消费者的偏好和购物习惯,为零售商提供精准的市场洞察。
解决学术问题
该数据集为解决稀疏数据环境下的产品推荐问题提供了重要支持。在零售领域,许多产品的购买频率较低,导致数据稀疏性,传统的推荐算法难以有效处理。Detego Shopping Basket Dataset 通过提供大规模的购物篮数据,帮助研究者开发和验证基于嵌入的推荐系统,提升推荐算法的准确性和鲁棒性。此外,该数据集还为研究跨区域消费行为的异质性提供了基础,推动了零售个性化推荐领域的研究进展。
衍生相关工作
基于 Detego Shopping Basket Dataset,研究者们开展了多项经典工作。例如,Wölbitsch 等人利用该数据集提出了基于嵌入的稀疏数据增强方法,显著提升了零售场景下的推荐系统性能。此外,其他研究团队通过分析该数据集,开发了多种购物篮分析算法,用于挖掘产品关联规则和消费者行为模式。这些工作不仅推动了零售数据分析领域的发展,还为个性化推荐系统的优化提供了理论支持。
以上内容由遇见数据集搜集并总结生成



