Shopkart
收藏🛒 Shopkart 数据集详情概述
一、数据集简介
SHOPKART 是一个模拟的电子商务平台数据集,旨在建模现代在线零售生态系统的结构与运营。它通过整合商品浏览、订单处理和支付处理等关键业务功能,提供无缝的数字购物体验。
项目展示了电子商务系统的端到端工作流程,帮助理解从产品发现到交易完成的数据流。
二、核心功能模块
| 模块 | 说明 |
|---|---|
| 产品管理 | 商品列表、分类管理、库存跟踪 |
| 客户管理 | 客户数据及交互记录 |
| 订单处理 | 订单创建、跟踪及订单明细 |
| 支付处理 | 交易处理与支付记录 |
各模块相互关联,反映真实在线市场的业务依赖关系。
三、系统工作流程
- 客户浏览各分类商品
- 将商品添加至订单
- 订单被处理并记录
- 完成支付并跟踪
该流程模拟了真实电商运营的典型客户旅程。
四、用途与应用场景
- 理解关系型数据库设计
- 探索电商业务逻辑
- 执行销售与客户行为分析
- 练习结构化数据集上的SQL查询
- 研究交易与订单模式
五、项目结构
SHOPKART/ ├── Assets/ # 图片、图表、媒体文件 ├── Data/ # 原始数据集文件 │ ├── Category.txt │ ├── Customers.txt │ ├── Order_Items.txt │ ├── Orders.txt │ ├── Payments.txt │ └── Products.txt ├── Reports/ # 仪表板与报告 │ ├── Report Shopkart.pbix # Power BI 交互报告 │ └── Report Shopkart.pdf # Power BI 静态报告 ├── SQL/ # 数据库架构与查询文件 │ ├── Shopkart - Database & Table Schema.sql │ └── Shopkart Analytical Questions.sql └── README.md
六、技术栈
| 工具 | 用途 |
|---|---|
| SQL | 数据建模、查询、分析 |
| Microsoft Excel | 数据清洗与仪表板 |
| Power BI | 交互式数据可视化 |
| Markdown | 文档编写 |
七、数据库设计
采用关系型模型,连接以下实体:
- 客户 (Customers)
- 订单 (Orders)
- 产品 (Products)
- 分类 (Categories)
- 支付 (Payments)
- 订单项 (Order Items)
实体间通过定义的关系连接,确保数据完整性和高效查询。包含实体关系图(ER Diagram)。
八、仪表板与关键指标
8.1 Excel 仪表板 — Shopkart 概览
- 总营收: 432M+ 卢比
- 订单量: 12,000+ 笔
- 客户数: 3,000+ 人
- 平均订单价值: 约 38K 卢比
- 重复购买率: 79%
- 关键发现:收入呈季节性波动;电子、运动健身为高收入类目;数字支付主导;26-35岁为核心客户群。
8.2 Power BI 仪表板
(1) 执行概览仪表板
- 总营收: 459M+ 卢比
- 订单量: 约 12,000 笔
- 客户数: 3,000+ 人
- 平均订单价值: 约 39.5K 卢比
- 重复购买率: 80.95%
- 取消率: 6.5%;UPI支付占比约50%
(2) 产品与销售分析仪表板
- 分析库存与销售关系,识别高收入低库存(潜在缺货风险)和高库存低销售(库存效率低下)类别
- 展示不同GST税率对收入的影响
- 前10名产品表现(含收入、销量、评分)
- 各分类收入分布
(3) 客户与地理分析仪表板
- 客户增长趋势(20-39岁为主要客户群)
- 性别分布基本平衡(男性约52%)
- 主要收入城市:德里、孟买、班加罗尔、海得拉巴
- 订单领先邦:马哈拉施特拉邦、旁遮普邦、卡纳塔克邦
九、可探索的关键洞察
- 客户购买行为
- 各分类产品表现
- 收入与交易趋势
- 订单频率与生命周期模式
- 支付方式分布与偏好
- 高收入城市排行
十、关键指标汇总
| 指标 | 说明 |
|---|---|
| 总营收 | 衡量整体销售业绩 |
| 总订单数 | 运营规模指标 |
| 总客户数 | 用户规模指标 |
| 平均订单价值 (AOV) | 客户消费能力指标 |
| 客户留存率 | 客户忠诚度指标 |
| 客户收入贡献 | 客户价值细分 |
十一、样本洞察示例
- 电子类目贡献了总收入的显著部分
- 绝大多数交易通过数字支付完成,以UPI为主
- 订单取消集中发生在特定区域
- 重复购买客户对整体收入贡献显著
十二、目标与未来规划
项目目标:弥合理论数据库概念与真实电商业务应用之间的差距。
未来扩展方向:
- 扩展和丰富数据集,引入供应商、评论、物流等实体,增加分析深度
十三、许可
本项目仅用于教育目的和分析目的。




