Online Retail II
收藏github2024-06-15 更新2024-06-19 收录
下载链接:
https://github.com/ebruiserisobay/association_rule_based_recommender_system-retail-dataset-
下载链接
链接失效反馈官方服务:
资源简介:
Online Retail II数据集包含了一家英国零售公司从2009年12月1日至2011年12月9日的在线销售交易记录。该公司的产品目录主要包含礼品,且大多数客户为批发商。数据集字段包括发票号、产品代码、产品描述、销售数量、发票日期、单价、客户ID和国家。
The Online Retail II dataset comprises online sales transaction records of a UK-based retail company from December 1, 2009, to December 9, 2011. The company's product catalog primarily includes gifts, with the majority of customers being wholesalers. The dataset fields include invoice number, product code, product description, quantity sold, invoice date, unit price, customer ID, and country.
创建时间:
2024-06-15
原始信息汇总
数据集概述
数据集名称
ARL Association Rule Based Recommender System (Retail)
数据集内容
该数据集包含英国一家零售公司从2009年12月1日至2011年12月9日的在线销售交易记录。主要产品为礼品,客户多为批发商。
数据集字段
- InvoiceNo: 发票号码(以C开头的代码表示交易已取消)
- StockCode: 产品代码(每个产品唯一)
- Description: 产品名称
- Quantity: 产品数量(发票中每种产品的销售数量)
- InvoiceDate: 发票日期
- UnitPrice: 发票价格(英镑)
- CustomerID: 唯一客户编号
- Country: 国家名称
数据集用途
用于基于关联规则的推荐系统,为特定用户篮子提供产品推荐。决策规则来源于2010-2011年德国客户的数据。
搜集汇总
数据集介绍

构建方式
该数据集的构建基于英国一家零售公司2009年12月1日至2011年12月9日间的在线销售交易记录。通过收集和整理这些交易数据,形成了包含详细交易信息的Online Retail II数据集。数据集涵盖了多种商品的销售情况,包括商品的唯一识别码、描述、销售数量、交易日期、单价、客户唯一识别码以及交易发生的国家。这些数据的收集和整理为后续的数据分析和推荐系统构建提供了坚实的基础。
特点
Online Retail II数据集的主要特点在于其丰富的交易信息和广泛的时间跨度。数据集不仅包含了商品的基本信息,如库存代码和描述,还详细记录了每笔交易的各项参数,如交易数量、日期和单价。此外,数据集还区分了已取消的交易,通过发票号码前缀为'C'来标识。这些特点使得该数据集在研究消费者行为、市场趋势分析以及构建推荐系统等方面具有极高的应用价值。
使用方法
使用该数据集时,研究者可以首先根据交易数据进行消费者行为分析,识别出不同商品之间的关联规则。例如,通过分析用户购物篮中的商品组合,可以推导出潜在的购买模式。此外,该数据集还可用于构建基于关联规则的推荐系统,通过分析历史交易数据为用户提供个性化的商品推荐。在使用过程中,研究者需注意处理已取消的交易,并根据具体研究目的选择合适的分析方法和工具。
背景与挑战
背景概述
Online Retail II数据集记录了英国一家零售公司从2009年12月1日至2011年12月9日的在线销售交易。该数据集由核心研究人员或机构在研究电子商务推荐系统时创建,旨在通过分析大量交易数据来优化产品推荐策略。其核心研究问题是如何基于历史交易数据,利用关联规则为顾客提供精准的产品推荐。该数据集的发布对电子商务领域的推荐系统研究产生了深远影响,为后续研究提供了宝贵的数据资源。
当前挑战
Online Retail II数据集在构建过程中面临多个挑战。首先,数据集涵盖了两年多的交易记录,如何从海量数据中提取有用的关联规则是一个主要挑战。其次,数据集中包含了大量的取消交易记录,这些记录对推荐系统的准确性构成了干扰。此外,由于数据集主要涉及批发客户,如何针对不同类型的客户群体进行个性化推荐也是一个亟待解决的问题。最后,数据集的时效性问题也不容忽视,如何确保推荐系统能够适应市场的快速变化,是该数据集应用中的一个重要挑战。
常用场景
经典使用场景
在零售领域,Online Retail II数据集的经典使用场景主要集中在基于关联规则的推荐系统构建。通过分析用户购物篮中的商品组合,系统能够预测并推荐最可能被用户购买的商品。例如,对于用户1的购物篮中包含产品ID 21987,系统可以推荐与其高度关联的其他产品,从而提高销售转化率。
解决学术问题
该数据集解决了零售业中常见的个性化推荐问题,通过挖掘商品间的关联规则,为学术研究提供了丰富的数据支持。研究者可以利用这些数据验证和优化推荐算法,提升推荐系统的准确性和用户满意度。此外,数据集还为探索用户行为模式和市场趋势提供了宝贵的资源,推动了零售分析领域的学术进展。
衍生相关工作
基于Online Retail II数据集,研究者们开展了多项经典工作,包括但不限于关联规则挖掘、用户行为分析和个性化推荐系统的优化。例如,有研究通过该数据集验证了Apriori算法在零售推荐中的有效性,并提出了改进的FP-Growth算法。此外,还有工作探讨了如何利用该数据集进行用户细分和市场细分,为零售策略的制定提供了科学依据。
以上内容由遇见数据集搜集并总结生成



