five

Shopkart

收藏
github2026-05-01 更新2026-05-04 收录
下载链接:
https://github.com/TusharSidhu/Shopkart
下载链接
链接失效反馈
官方服务:
资源简介:
Shopkart是一个模拟的电子商务平台数据集,设计用于模拟现代在线零售生态系统的结构和操作。它通过整合关键业务功能(如产品浏览、订单处理和支付处理)提供无缝的数字购物体验。数据集包含六个相互关联的表(Customers、Category、Products、Orders、Order_Items、Payments),旨在支持在Excel、MySQL和Power BI中进行查询、数据建模、分析和生成可操作的见解。

Shopkart is a simulated e-commerce platform dataset designed to replicate the structure and operational processes of modern online retail ecosystems. It provides a seamless digital shopping experience by integrating core business functions including product browsing, order processing and payment processing. The dataset contains six interrelated tables: Customers, Category, Products, Orders, Order_Items and Payments, which aims to support querying, data modeling, analysis and the generation of actionable insights in Excel, MySQL and Power BI.
创建时间:
2026-04-20
原始信息汇总

🛒 Shopkart 数据集详情概述

一、数据集简介

SHOPKART 是一个模拟的电子商务平台数据集,旨在建模现代在线零售生态系统的结构与运营。它通过整合商品浏览、订单处理和支付处理等关键业务功能,提供无缝的数字购物体验。

项目展示了电子商务系统的端到端工作流程,帮助理解从产品发现到交易完成的数据流。


二、核心功能模块

模块 说明
产品管理 商品列表、分类管理、库存跟踪
客户管理 客户数据及交互记录
订单处理 订单创建、跟踪及订单明细
支付处理 交易处理与支付记录

各模块相互关联,反映真实在线市场的业务依赖关系。


三、系统工作流程

  1. 客户浏览各分类商品
  2. 将商品添加至订单
  3. 订单被处理并记录
  4. 完成支付并跟踪

该流程模拟了真实电商运营的典型客户旅程。


四、用途与应用场景

  • 理解关系型数据库设计
  • 探索电商业务逻辑
  • 执行销售与客户行为分析
  • 练习结构化数据集上的SQL查询
  • 研究交易与订单模式

五、项目结构

SHOPKART/ ├── Assets/ # 图片、图表、媒体文件 ├── Data/ # 原始数据集文件 │ ├── Category.txt │ ├── Customers.txt │ ├── Order_Items.txt │ ├── Orders.txt │ ├── Payments.txt │ └── Products.txt ├── Reports/ # 仪表板与报告 │ ├── Report Shopkart.pbix # Power BI 交互报告 │ └── Report Shopkart.pdf # Power BI 静态报告 ├── SQL/ # 数据库架构与查询文件 │ ├── Shopkart - Database & Table Schema.sql │ └── Shopkart Analytical Questions.sql └── README.md


六、技术栈

工具 用途
SQL 数据建模、查询、分析
Microsoft Excel 数据清洗与仪表板
Power BI 交互式数据可视化
Markdown 文档编写

七、数据库设计

采用关系型模型,连接以下实体:

  • 客户 (Customers)
  • 订单 (Orders)
  • 产品 (Products)
  • 分类 (Categories)
  • 支付 (Payments)
  • 订单项 (Order Items)

实体间通过定义的关系连接,确保数据完整性和高效查询。包含实体关系图(ER Diagram)。


八、仪表板与关键指标

8.1 Excel 仪表板 — Shopkart 概览

  • 总营收: 432M+ 卢比
  • 订单量: 12,000+ 笔
  • 客户数: 3,000+ 人
  • 平均订单价值: 约 38K 卢比
  • 重复购买率: 79%
  • 关键发现:收入呈季节性波动;电子、运动健身为高收入类目;数字支付主导;26-35岁为核心客户群。

8.2 Power BI 仪表板

(1) 执行概览仪表板

  • 总营收: 459M+ 卢比
  • 订单量: 约 12,000 笔
  • 客户数: 3,000+ 人
  • 平均订单价值: 约 39.5K 卢比
  • 重复购买率: 80.95%
  • 取消率: 6.5%;UPI支付占比约50%

(2) 产品与销售分析仪表板

  • 分析库存与销售关系,识别高收入低库存(潜在缺货风险)和高库存低销售(库存效率低下)类别
  • 展示不同GST税率对收入的影响
  • 前10名产品表现(含收入、销量、评分)
  • 各分类收入分布

(3) 客户与地理分析仪表板

  • 客户增长趋势(20-39岁为主要客户群)
  • 性别分布基本平衡(男性约52%)
  • 主要收入城市:德里、孟买、班加罗尔、海得拉巴
  • 订单领先邦:马哈拉施特拉邦、旁遮普邦、卡纳塔克邦

九、可探索的关键洞察

  • 客户购买行为
  • 各分类产品表现
  • 收入与交易趋势
  • 订单频率与生命周期模式
  • 支付方式分布与偏好
  • 高收入城市排行

十、关键指标汇总

指标 说明
总营收 衡量整体销售业绩
总订单数 运营规模指标
总客户数 用户规模指标
平均订单价值 (AOV) 客户消费能力指标
客户留存率 客户忠诚度指标
客户收入贡献 客户价值细分

十一、样本洞察示例

  • 电子类目贡献了总收入的显著部分
  • 绝大多数交易通过数字支付完成,以UPI为主
  • 订单取消集中发生在特定区域
  • 重复购买客户对整体收入贡献显著

十二、目标与未来规划

项目目标:弥合理论数据库概念与真实电商业务应用之间的差距。

未来扩展方向

  • 扩展和丰富数据集,引入供应商、评论、物流等实体,增加分析深度

十三、许可

本项目仅用于教育目的和分析目的

搜集汇总
数据集介绍
main_image_url
构建方式
Shopkart是一个模拟电子商务平台的数据集,旨在再现现代在线零售生态系统的完整运作流程。其构建基于关系型数据库模型,通过定义客户、订单、产品、类别、支付和订单项等核心实体,并建立它们之间的关联,确保数据的一致性与查询效率。项目的原始数据以文本文件形式存储,涵盖类别、客户、订单项、订单、支付和产品等六个维度,并辅以SQL脚本描述数据库模式与分析查询。此外,还包括使用Excel和Power BI构建的仪表盘,用于可视化业务绩效。这种设计使得数据能够真实反映从产品浏览、订单处理到支付完成的端到端业务流程,服务于学习与分析目的。
特点
该数据集的核心特点在于其高度的模拟真实性与结构化设计。它提供了超过12K笔订单、3K名客户以及4.32亿印度卢比总营收的规模,展现出丰富的分析维度。尤为突出的是,其具有79%的高重复客户率,表明客户留存能力强劲;而电子与运动健身类别在营收中占据主导地位,呈现典型的帕累托效应,即少数产品贡献大部分收入。在支付行为上,数字支付方式(尤其是UPI)占据约50%的份额,反映了现代消费习惯。地理分布显示马哈拉施特拉邦、旁遮普邦和卡纳塔克邦为高订单量区域。这些特征共同构成了一个多维度的商业洞察数据集,适用于深入探索用户行为、产品表现与市场趋势。
使用方法
使用Shopkart数据集时,用户可首先通过SQL文件构建数据库模式并导入文本数据,以此实践关系型数据库的设计与查询技能。随后,可运行附带的SQL分析查询,探索营收趋势、订单状态分布、类别绩效及客户人口统计等洞见。更进一步,用户可利用Excel或Power BI仪表盘进行交互式可视化分析,动态筛选不同维度,如时间周期、地域或支付方式,以揭示隐藏的模式。例如,通过散点图分析库存与销售的关系,识别潜在缺货风险;或通过柱状图评估不同GST税率对营收的影响。该数据集尤其适合用于教学场景,帮助学习者将理论数据库知识应用于真实的电子商务商业逻辑分析。
背景与挑战
背景概述
Shopkart是一个模拟电子商务平台的数据集,由开发者TusharSidhu创建,旨在模拟现代在线零售生态系统的结构与运营流程。该数据集整合了产品管理、客户管理、订单处理与支付处理等核心业务模块,覆盖从产品发现到交易完成的端到端工作流。其核心研究问题聚焦于如何通过关系型数据库建模与商业智能分析,揭示电子商务运营中的数据流动规律与业务逻辑。自发布以来,Shopkart作为教育与分析工具,在数据库设计、SQL查询实践、销售与客户行为分析等领域产生了广泛影响力,为学习者与从业者提供了宝贵的实战资源。
当前挑战
Shopkart所解决的领域问题在于电子商务场景下的数据分析复杂性,包括客户购买行为模式挖掘、产品类别绩效评估、收入趋势预测及支付偏好分布等。构建过程中面临的核心挑战包括:模拟真实商业数据中订单状态多样性(如交付、取消、退货)与客户留存率(约80%)的平衡;设计电子、运动等品类的销售分布符合帕累托效应的数据生成;集成多来源数据(产品、订单、支付)并确保关系型数据库的完整性与一致性;以及通过Power BI与Excel构建交互式仪表板时,处理动态过滤、地理层级聚合与高维指标的可视化呈现。
常用场景
经典使用场景
Shopkart作为模拟电商平台的数据集,其经典使用场景聚焦于理解现代在线零售生态系统的端到端数据流。研究者可借助该数据集剖析从商品浏览、订单生成到支付完成的完整业务流程,并通过关系型数据库设计深化对数据实体间依赖关系的认知。例如,通过查询客户、订单、产品、类别、支付和订单项等多张表格的关联,能够模拟真实的交易链路,进而开展销售分析、客户分群及库存优化等经典分析任务。该数据集为初学者与从业者提供了从理论到实践的桥梁,尤其适用于SQL查询练习与商业逻辑验证。
解决学术问题
该数据集有效解决了电商领域学术研究中的几项核心问题:首先,它提供了可复现的结构化数据,助力学者探究客户购买行为模式与产品品类表现之间的内在关联;其次,通过订单状态分布与支付偏好特征,能够深入分析运营效率与用户决策机制;再者,数据集中的地理位置信息与复购率指标,为研究区域市场差异与客户忠诚度驱动因素提供了实证基础。其意义在于搭建了从理论模型到实际业务分析的实验平台,推动数据驱动型零售研究的标准化与可对比性,尤其在交易规律挖掘与行为经济学验证方向上影响深远。
衍生相关工作
围绕Shopkart数据集已衍生出多项经典工作:一方面,基于其关系型架构的研究者开发了自动化分析流水线,用于生成客户生命周期价值(CLV)模型与复购预测算法;另一方面,该数据集被用作基准测试集,验证新型数据可视化工具或商业智能框架的性能,例如在Power BI互动仪表盘设计中引入动态筛选与地理热图分析。此外,部分扩展工作引入了供应商评价、用户评论情感分析等额外实体,进一步丰富了电商数据生态的分析维度。这些衍生研究不仅深化了对零售数据流的理解,也为后续多模态电商数据集的设计提供了范式参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作