Amazon Sales Dataset|电子商务数据集|销售分析数据集
收藏Amazon-Sales-Data-Analytics
简介
Amazon Sales Data Analysis 涉及对亚马逊平台上的销售交易数据进行检查和解释。这种分析对于在亚马逊上销售产品的企业和个人至关重要,因为它提供了有关销售表现、客户行为、市场趋势和产品有效性的宝贵见解。
目录
- 导入数据集
- 数据准备和清理
- 数据可视化
导入数据集
导入Python库(如Pandas、Numpy、Matplotlib和Seaborn)到Jupyter Notebook中。从Kaggle下载Amazon Sales数据集,并将其作为数据框导入Jupyter Notebook。
数据准备和清理
数据准备
从导入的数据集中查看列和数据,提取需要分析以进行可视化的必要数据。
数据清理
在数据清理过程中,清理数据集中的重复值。这些重复值可能会干扰可视化过程。重命名感兴趣的列,并忽略数据集中的空值。
数据可视化
数据可视化帮助我们通过一些创新的图表了解数据信息。
计数图
计数图是一种条形图,表示分类变量中每个类别的频率或计数。它通常用于探索性数据分析(EDA),以可视化分类数据的分布。
条形图
条形图是一种多功能可视化工具,通过矩形条表示分类变量和数值变量之间的关系。当用于显示商品数量时,条形图可以有效地说明每个尺寸类别的商品数量。
双数据计数图
计数图是一种有效的可视化工具,用于显示分类变量中类别的频率。当用于显示商品的快递状态时,计数图可以说明每个状态类别的商品数量。
尺寸直方图
直方图是可视化数值数据分布的有用工具,如亚马逊数据集中商品的尺寸。它通过将数据分成区间(箱)并显示每个区间中的商品数量来表示不同尺寸范围的频率。
类别直方图
直方图通常用于数值数据,但在处理分类数据时,条形图更为合适。如果考虑使用直方图式的方法表示每个类别中的商品数量,可以帮助可视化不同类别中商品的分布。
饼图(Fulfilment)
饼图是一种有效的工具,用于可视化数据集中不同类别的比例,特别是当你想展示各个部分如何构成整体时。在亚马逊数据集中,饼图可以用于说明商品的履行方式的分布。
类别散点图
亚马逊数据集中商品类别的散点图可视化表示两个数值变量(如价格和评分)之间的关系。每个点对应一个商品,其位置由其价格和评分决定。
按州计数的条形图
按州计数的条形图为亚马逊数据集中商品的分布提供了一个清晰的视觉表示。每个条形图代表一个州,条形的高度表示该州中的商品数量。
结论
亚马逊数据集的可视化(如散点图和条形图)提供了数据分布和关系的有价值见解。散点图揭示了不同产品类别中数值变量(如价格和评分)之间的模式和相关性,帮助识别趋势和异常值。条形图则提供了商品在不同州或条件下的分布的直观视图,突出了库存水平和可用性。通过利用这些见解,企业可以优化其运营并更好地满足客户需求。

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
AGIEval
displayName: AGIEval license: - MIT taskTypes: [] mediaTypes: - Text labelTypes: [] tags: - attrs: null id: 11864 name: en: '' zh: 文本检索 publisher: - Microsoft publishDate: '2023-04-01' publishUrl: https://huggingface.co/datasets/lighteval/agi_eval_en paperUrl: https://arxiv.org/pdf/2304.06364.pdf --- # 数据集介绍 ## 简介 AGIEval is a human-centric benchmark specifically designed to evaluate the general abilities of foundation models in tasks pertinent to human cognition and problem-solving. This benchmark is derived from 20 official, public, and high-standard admission and qualification exams intended for general human test-takers, such as general college admission tests (e.g., Chinese College Entrance Exam (Gaokao) and American SAT), law school admission tests, math competitions, lawyer qualification tests, and national civil service exams. For a full description of the benchmark ## 引文 ``` @misc{zhong2023agieval, title={AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models}, author={Wanjun Zhong and Ruixiang Cui and Yiduo Guo and Yaobo Liang and Shuai Lu and Yanlin Wang and Amin Saied and Weizhu Chen and Nan Duan}, year={2023}, eprint={2304.06364}, archivePrefix={arXiv}, primaryClass={cs.CL} ``` ## Download dataset :modelscope-code[]{type="git"}
魔搭社区 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录