Walmart Sales Data
收藏github2024-05-04 更新2024-05-31 收录
下载链接:
https://github.com/HarshChaudhary1312/SQL-Walmart_Sales_Data_Analysis
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自Walmart三个不同分支(Mandalay, Yangon, Naypyitaw)的销售交易记录,共有17个字段和1000行数据,涵盖了从发票ID、分支、城市到产品线、单价、数量等多个方面的详细信息。
This dataset comprises sales transaction records from three different branches of Walmart (Mandalay, Yangon, Naypyitaw), consisting of 17 fields and 1000 rows of data. It provides detailed information across various aspects, including invoice ID, branch, city, product line, unit price, and quantity.
创建时间:
2024-04-12
原始信息汇总
数据集概述
数据集名称
Walmart Sales Data Analysis
数据集目的
- 探索Walmart销售数据,理解表现最佳的分支和产品。
- 分析不同产品的销售趋势。
- 研究客户行为,以优化和改进销售策略。
数据集内容
- 包含来自缅甸三个Walmart分支(Mandalay, Yangon, Naypyitaw)的销售交易数据。
- 数据集包含17列和1000行。
| 列名 | 描述 | 数据类型 |
|---|---|---|
| invoice_id | 销售发票编号 | VARCHAR(30) |
| branch | 销售发生的分支 | VARCHAR(5) |
| city | 分支所在的城市 | VARCHAR(30) |
| customer_type | 客户类型 | VARCHAR(30) |
| gender | 购买客户的性别 | VARCHAR(10) |
| product_line | 销售的产品线 | VARCHAR(100) |
| unit_price | 每件产品的价格 | DECIMAL(10, 2) |
| quantity | 销售的产品数量 | INT |
| VAT | 购买税额 | FLOAT(6, 4) |
| total | 购买总成本 | DECIMAL(10, 2) |
| date | 购买日期 | DATE |
| time | 购买时间 | TIMESTAMP |
| payment_method | 支付总金额 | DECIMAL(10, 2) |
| cogs | 销售成本 | DECIMAL(10, 2) |
| gross_margin_percentage | 毛利百分比 | FLOAT(11, 9) |
| gross_income | 毛收入 | DECIMAL(10, 2) |
| rating | 评分 | FLOAT(2, 1) |
分析列表
- 产品分析
- 分析不同产品线,识别表现最佳和需要改进的产品线。
- 销售分析
- 分析产品销售趋势,评估销售策略的有效性。
- 客户分析
- 揭示不同客户细分市场,购买趋势及各客户细分市场的盈利性。
分析方法
- 数据整理
- 检查并处理缺失或NULL值。
- 特征工程
- 生成新列,如
time_of_day、day_name和month_name,以分析销售时间和周期性趋势。
- 生成新列,如
- 探索性数据分析
- 回答项目目标中的问题。
业务问题
- 包括产品、销售和客户相关的多个问题,如产品线的销售表现、支付方式的流行度、客户类型的购买行为等。
搜集汇总
数据集介绍

构建方式
该数据集通过收集来自沃尔玛三个不同分支(曼德勒、仰光和内比都)的销售交易数据构建而成。数据集包含17列和1000行,涵盖了从发票编号、分支信息、城市位置到客户类型、性别、产品线、单价、销售数量、增值税、总费用、日期、时间、支付方式、销售成本、毛利率、毛收入和客户评分的详细信息。数据集的构建过程中,特别注重了数据的完整性,确保每一列都设置了‘NOT NULL’约束,从而避免了空值的出现。此外,通过特征工程,新增了‘time_of_day’、‘day_name’和‘month_name’等列,以进一步分析销售趋势和客户行为。
使用方法
使用该数据集时,首先需将仓库克隆至本地机器,然后打开位于‘/Visualizations’目录下的Excel工作簿。通过使用切片器和过滤器,用户可以交互式地探索各个工作表和可视化内容,从而深入分析销售数据。此外,用户可参考README.md文件,获取更多关于如何解读可视化内容和理解项目范围的指导。该数据集适用于产品分析、销售分析和客户分析等多个领域,能够帮助用户优化销售策略并提升业务表现。
背景与挑战
背景概述
沃尔玛销售数据集(Walmart Sales Data)是由沃尔玛公司提供的销售交易数据,旨在通过分析不同分支机构的销售表现、产品趋势和客户行为,优化销售策略。该数据集涵盖了位于曼德勒、仰光和内比都的三个沃尔玛分支机构的销售记录,包含17列和1000行数据,涵盖了从发票信息到客户类型、产品线、价格、销售日期和时间等多个维度。该数据集的创建旨在帮助研究人员和商业分析师深入理解销售动态,识别最佳表现的分支和产品,并为销售策略的改进提供数据支持。
当前挑战
沃尔玛销售数据集面临的挑战主要集中在数据分析的复杂性和业务问题的多样性上。首先,数据集涉及多个分支机构和产品线,如何在不同分支和产品之间进行有效的比较和分析是一个关键挑战。其次,数据集中包含了时间、日期、客户类型等多个维度,如何从这些维度中提取有价值的信息,以支持销售策略的优化,是另一个重要挑战。此外,数据集中的特征工程和探索性数据分析(EDA)过程需要处理大量的数据清洗和特征生成任务,以确保分析结果的准确性和可靠性。最后,如何将分析结果有效地转化为实际业务决策,也是一个需要克服的挑战。
常用场景
经典使用场景
Walmart Sales Data数据集的经典使用场景主要集中在销售分析、产品分析和客户行为分析。通过该数据集,研究者可以深入探讨不同产品线的销售表现,识别最畅销的产品类别,并分析各分支机构的销售趋势。此外,该数据集还可用于研究客户类型与购买行为之间的关系,从而为零售策略的优化提供数据支持。
解决学术问题
Walmart Sales Data数据集解决了零售业中多个关键的学术研究问题。首先,它为研究者提供了分析销售趋势和产品表现的数据基础,有助于理解市场需求的变化。其次,通过分析客户行为和购买模式,该数据集为零售业中的客户细分和个性化营销策略提供了理论依据。最后,该数据集还为研究销售策略的有效性和优化提供了实证支持,推动了零售管理领域的学术研究。
实际应用
Walmart Sales Data数据集在实际应用中具有广泛的潜力。零售企业可以利用该数据集进行销售预测,优化库存管理,并制定更具针对性的营销策略。此外,通过分析不同分支机构的销售数据,企业可以识别表现优异的门店,并推广其成功经验。该数据集还可用于培训和教育,帮助零售从业者提升数据分析能力,从而更好地应对市场竞争。
数据集最近研究
最新研究方向
在零售业数据分析领域,Walmart Sales Data数据集的研究正聚焦于通过深入挖掘销售数据来优化销售策略。研究者们致力于通过产品分析、销售趋势分析和客户行为分析,揭示不同产品线的表现差异、销售策略的有效性以及客户细分市场的购买模式。这些研究不仅有助于识别高绩效分支和产品,还能为制定更具针对性的营销策略提供数据支持。此外,随着数据驱动决策在零售业的普及,该数据集的研究成果对于提升企业竞争力和市场份额具有重要意义。
以上内容由遇见数据集搜集并总结生成



