five

Online Retail II dataset

收藏
github2024-06-15 更新2024-07-10 收录
下载链接:
https://github.com/ebruiserisobay/association_rule_based_recommender_system-retail-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Online Retail II数据集包含了一家英国零售公司在2009年12月1日至2011年9月12日之间的在线销售交易记录。该公司的产品目录包括礼品,其大多数客户为批发商。

The Online Retail II Dataset contains online sales transaction records of a UK retail company from December 1, 2009 to September 12, 2011. The company's product catalog covers gifts, and the majority of its customers are wholesalers.
创建时间:
2024-06-15
原始信息汇总

ARL Association Rule Based Recommender System (Retail)

业务问题

以下是三个不同用户的购物篮详情。使用关联规则为这些购物篮详情提供了最合适的产品推荐。

决策规则来源于2010-2011年德国客户数据。

  • 用户1购物篮中的产品ID:21987
  • 用户2购物篮中的产品ID:22747

数据集介绍

Online Retail II数据集包含了一家英国零售公司在2009年12月1日至2011年12月9日之间的在线销售交易记录。该公司的产品目录包括礼品,其大多数客户为批发商。

  • InvoiceNo: 发票号码(如果此代码以C开头,表示交易已取消)
  • StockCode: 产品代码(每个产品唯一)
  • Description: 产品名称
  • Quantity: 产品数量(发票中每种产品的销售数量)
  • InvoiceDate: 发票日期
  • UnitPrice: 发票价格(以英镑为单位)
  • CustomerID: 唯一客户编号
  • Country: 国家名称
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集,即Online Retail II dataset,源自英国一家零售公司的在线销售交易记录,涵盖了2009年12月1日至2011年12月9日的时间段。数据集的构建基于该公司在英国市场的销售活动,包括了多种礼品商品的交易详情。通过收集和整理每笔交易的详细信息,如发票编号、产品代码、产品名称、销售数量、发票日期、单价、客户编号及所属国家,构建了一个全面且细致的销售数据集。
特点
Online Retail II dataset的显著特点在于其包含了丰富的交易细节,涵盖了从产品信息到客户行为的多个维度。数据集中的每一条记录都详细描述了单次交易的具体内容,包括产品的唯一标识、销售数量及价格等关键信息。此外,数据集还特别标注了交易是否被取消,通过发票编号的特殊前缀进行区分,增强了数据的可解释性和实用性。
使用方法
使用该数据集时,研究者可以通过分析不同产品的销售趋势、客户购买行为及市场反应,来制定更为精准的市场策略和产品推荐系统。例如,可以利用数据集中的关联规则挖掘技术,根据用户的购物篮内容推荐最合适的产品。此外,数据集还可用于预测模型构建,通过历史交易数据预测未来的销售情况,从而优化库存管理和市场投放策略。
背景与挑战
背景概述
Online Retail II数据集记录了英国一家零售公司从2009年12月1日至2011年12月9日的在线销售交易。该数据集包含了详细的交易信息,如发票编号、产品代码、产品名称、数量、发票日期、单价、客户ID和客户所在国家。该公司的产品主要为礼品,且其客户多为批发商。此数据集的创建旨在支持基于关联规则的推荐系统研究,特别是在零售领域,为研究人员提供了一个丰富的数据资源,以探索和优化推荐算法。
当前挑战
该数据集在构建和应用过程中面临若干挑战。首先,数据集中的交易信息涉及大量商品和客户,如何高效地处理和分析这些数据是一个主要挑战。其次,由于数据集涵盖了两年多的时间跨度,数据的时间序列特性增加了分析的复杂性。此外,数据集中包含的取消交易(以C开头的发票编号)需要特别处理,以确保分析结果的准确性。最后,基于关联规则的推荐系统需要处理高维度的商品空间,如何在保证推荐质量的同时提高计算效率也是一个重要挑战。
常用场景
经典使用场景
在零售行业中,Online Retail II数据集被广泛用于构建基于关联规则的推荐系统。通过分析用户购物篮中的商品组合,该数据集能够揭示商品之间的潜在关联性,从而为零售商提供精准的产品推荐策略。例如,基于用户的历史购买记录,系统可以预测用户可能感兴趣的其他商品,从而提高销售额和用户满意度。
实际应用
在实际应用中,Online Retail II数据集被零售企业用于优化库存管理和提升客户体验。通过分析数据集中的销售趋势和客户行为,企业可以更准确地预测市场需求,调整库存策略,减少库存积压和缺货现象。同时,基于数据集构建的推荐系统能够为顾客提供个性化的购物建议,增强顾客忠诚度和购买意愿。
衍生相关工作
基于Online Retail II数据集,研究者们开发了多种推荐算法和模型,如基于关联规则的推荐系统、协同过滤算法等。这些工作不仅在学术界引起了广泛关注,还被应用于实际的零售业务中,推动了零售行业的智能化和数据化进程。此外,该数据集还促进了零售数据分析工具的发展,为零售企业提供了更多数据驱动的决策支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作