Amazon Sales Dataset|电子商务数据集|销售分析数据集
收藏Amazon-Sales-Data-Analytics
简介
Amazon Sales Data Analysis 涉及对亚马逊平台上的销售交易数据进行检查和解释。这种分析对于在亚马逊上销售产品的企业和个人至关重要,因为它提供了有关销售表现、客户行为、市场趋势和产品有效性的宝贵见解。
目录
- 导入数据集
- 数据准备和清理
- 数据可视化
导入数据集
导入Python库(如Pandas、Numpy、Matplotlib和Seaborn)到Jupyter Notebook中。从Kaggle下载Amazon Sales数据集,并将其作为数据框导入Jupyter Notebook。
数据准备和清理
数据准备
从导入的数据集中查看列和数据,提取需要分析以进行可视化的必要数据。
数据清理
在数据清理过程中,清理数据集中的重复值。这些重复值可能会干扰可视化过程。重命名感兴趣的列,并忽略数据集中的空值。
数据可视化
数据可视化帮助我们通过一些创新的图表了解数据信息。
计数图
计数图是一种条形图,表示分类变量中每个类别的频率或计数。它通常用于探索性数据分析(EDA),以可视化分类数据的分布。
条形图
条形图是一种多功能可视化工具,通过矩形条表示分类变量和数值变量之间的关系。当用于显示商品数量时,条形图可以有效地说明每个尺寸类别的商品数量。
双数据计数图
计数图是一种有效的可视化工具,用于显示分类变量中类别的频率。当用于显示商品的快递状态时,计数图可以说明每个状态类别的商品数量。
尺寸直方图
直方图是可视化数值数据分布的有用工具,如亚马逊数据集中商品的尺寸。它通过将数据分成区间(箱)并显示每个区间中的商品数量来表示不同尺寸范围的频率。
类别直方图
直方图通常用于数值数据,但在处理分类数据时,条形图更为合适。如果考虑使用直方图式的方法表示每个类别中的商品数量,可以帮助可视化不同类别中商品的分布。
饼图(Fulfilment)
饼图是一种有效的工具,用于可视化数据集中不同类别的比例,特别是当你想展示各个部分如何构成整体时。在亚马逊数据集中,饼图可以用于说明商品的履行方式的分布。
类别散点图
亚马逊数据集中商品类别的散点图可视化表示两个数值变量(如价格和评分)之间的关系。每个点对应一个商品,其位置由其价格和评分决定。
按州计数的条形图
按州计数的条形图为亚马逊数据集中商品的分布提供了一个清晰的视觉表示。每个条形图代表一个州,条形的高度表示该州中的商品数量。
结论
亚马逊数据集的可视化(如散点图和条形图)提供了数据分布和关系的有价值见解。散点图揭示了不同产品类别中数值变量(如价格和评分)之间的模式和相关性,帮助识别趋势和异常值。条形图则提供了商品在不同州或条件下的分布的直观视图,突出了库存水平和可用性。通过利用这些见解,企业可以优化其运营并更好地满足客户需求。

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
微博与抖音评论数据集
数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。
github 收录
rule34lol-images-part1
该数据集包含来自rule34.lol图像板的196,000个图像文件的元数据。元数据包括URL、标签、文件信息和点赞数。实际图像文件存储在zip存档中,每个存档包含1000个图像。该数据集是更大集合的一部分,分为Part 1和Part 2。数据集采用CC0许可,允许免费使用、修改和分发,无需署名。
huggingface 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
World Bank - World Governance Indicators
世界银行的世界治理指标(World Governance Indicators, WGI)数据集提供了全球各国在六个治理维度上的评估数据,包括言论和问责、政治稳定和无暴力、政府效率、监管质量、法治以及腐败控制。这些指标基于多个来源的数据,旨在帮助政策制定者和研究人员了解和改善治理质量。
databank.worldbank.org 收录