Walmart Sales Data|零售销售数据集|数据分析数据集
收藏数据集概述
数据来源
数据内容
- 包含17个列和1000行数据。
- 主要列包括:
invoice_id
: 销售发票IDbranch
: 销售分支city
: 分支所在城市customer_type
: 客户类型gender
: 客户性别product_line
: 产品线unit_price
: 产品单价quantity
: 销售数量VAT
: 增值税total
: 总销售额date
: 销售日期time
: 销售时间payment_method
: 支付方式cogs
: 商品成本gross_margin_percentage
: 毛利率gross_income
: 毛利rating
: 评分
数据分析目的
- 分析Walmart销售数据,了解表现最佳的分支和产品,销售趋势,客户行为。
- 研究如何改进和优化销售策略。
分析列表
- 产品分析:分析不同产品线,找出表现最佳和需要改进的产品线。
- 销售分析:分析产品销售趋势,评估销售策略的有效性。
- 客户分析:揭示不同客户细分市场,购买趋势和每个客户细分的盈利性。
分析方法
- 数据整理:检查并处理NULL值和缺失值。
- 特征工程:从现有列生成新列,如
time_of_day
、day_name
和month_name
。 - 探索性数据分析:回答项目目标中的问题。
业务问题
- 包括产品、销售和客户三个方面的多个问题,如产品线的销售情况、支付方式的普遍性、客户类型的购买趋势等。
收入和利润计算
- 计算公式包括商品成本、增值税、总销售额、毛利和毛利率。
可视化
- 计划创建多种图表,如销售趋势图、产品线销售表现图、客户类型分析图等,以深入理解数据。

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录