eCommerce dataset
收藏github2024-07-24 更新2024-07-25 收录
下载链接:
https://github.com/endii17/SQL_Explore_Ecommerce_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集存储在公共的Google BigQuery数据集中,包含2017年通过Google Analytics收集的网站用户会话信息。数据集用于分析网站活动,如跳出率、收入最高的日期、页面用户行为等。
This dataset is hosted in a public Google BigQuery dataset, containing website user session data collected via Google Analytics in 2017. It is intended for analyzing website activities, such as bounce rate, highest-revenue days, user behavior on web pages, and more.
创建时间:
2024-07-23
原始信息汇总
电子商务数据集探索
数据集介绍
- 该电子商务数据集存储在公共的Google BigQuery数据集中,包含2017年用户在网站上的会话信息,数据来源于Google Analytics。
- 作者使用Google BigQuery工具编写和执行SQL查询,分析网站活动,如跳出率、收入最高的日子、页面用户行为等。
目标
- 网站活动概览
- 跳出率分析
- 收入分析
- 交易分析
- 产品分析
数据导入
- 数据集存储在Google BigQuery的公共数据集中,具体项目ID为
bigquery-public-data.google_analytics_sample.ga_sessions。 - 访问步骤:
- 登录Google Cloud Platform账户并创建新项目。
- 进入BigQuery控制台并选择新创建的项目。
- 在导航面板中选择“添加数据”,然后搜索项目。
- 输入项目ID并点击进入
ga_sessions_表。
数据集字段说明
| 字段名称 | 数据类型 | 描述 |
|---|---|---|
| fullVisitorId | STRING | 唯一访客ID |
| date | STRING | 会话日期,格式为YYYYMMDD |
| totals | RECORD | 会话中的聚合值 |
| totals.bounces | INTEGER | 总跳出次数(方便起见),跳出会话值为1,否则为空 |
| totals.hits | INTEGER | 会话中的总点击次数 |
| totals.pageviews | INTEGER | 会话中的总页面浏览次数 |
| totals.visits | INTEGER | 会话次数(方便起见),有交互事件的会话值为1,否则为空 |
| trafficSource.source | STRING | 流量来源,可能是搜索引擎名称、引用主机名或utm_source URL参数的值 |
| hits | RECORD | 包含所有类型点击的行和嵌套字段 |
| hits.eCommerceAction | RECORD | 会话中发生的所有电子商务点击信息 |
| hits.eCommerceAction.action_type | STRING | 动作类型,如产品列表点击、产品详情查看、添加到购物车等 |
| hits.product | RECORD | 包含增强型电子商务产品数据的点击行和嵌套字段 |
| hits.product.productQuantity | INTEGER | 购买的产品数量 |
| hits.product.productRevenue | INTEGER | 产品收入,以传递给Analytics的值乘以10^6表示(例如,2.40表示为2400000) |
| hits.product.productSKU | STRING | 产品SKU |
| hits.product.v2ProductName | STRING | 产品名称 |
搜集汇总
数据集介绍

构建方式
该eCommerce数据集构建于2017年,通过Google Analytics收集的用户网站会话信息,存储于Google BigQuery公共数据集中。数据集涵盖了用户会话的详细信息,包括用户ID、会话日期、总浏览量、页面浏览量、跳出率等关键指标。此外,数据集还包含了电子商务行为的具体记录,如产品列表点击、产品详情查看、购物车操作、结账和购买等。通过Google BigQuery工具,用户可以执行SQL查询,深入分析网站活动和用户行为。
特点
eCommerce数据集的显著特点在于其丰富的用户行为和电子商务交易数据。数据集不仅提供了用户会话的基本信息,还详细记录了用户的电子商务操作,如产品浏览、添加到购物车、购买等。这些数据为分析用户行为、优化营销策略和提升网站性能提供了宝贵的资源。此外,数据集的结构化设计使得数据处理和分析更为高效,支持复杂的查询和深入的业务洞察。
使用方法
使用eCommerce数据集,用户首先需登录Google Cloud Platform并创建一个新项目。随后,通过BigQuery控制台访问数据集,输入项目ID以获取数据。数据集支持SQL查询,用户可以编写查询语句以分析网站活动、跳出率、收入、交易和产品表现等。例如,通过查询可以计算产品列表视图的数量,或分析特定日期的收入情况。数据集的灵活性和详细记录使得用户能够进行多维度的业务分析和决策支持。
背景与挑战
背景概述
eCommerce数据集是一个存储在Google BigQuery中的公共数据集,由Google Analytics在2017年收集的用户网站会话信息组成。该数据集的核心研究问题包括网站活动的概览、跳出率分析、收入分析、交易分析以及产品分析等。通过使用Google BigQuery工具执行SQL查询,研究人员能够深入分析网站的商业状况和营销活动的效率。该数据集的创建旨在为电子商务领域的研究提供丰富的数据支持,帮助理解用户行为和优化营销策略。
当前挑战
eCommerce数据集在构建和应用过程中面临多项挑战。首先,数据集的规模庞大,处理和分析这些数据需要强大的计算资源和高效的算法。其次,数据的质量和一致性问题,如缺失值和异常值的处理,对分析结果的准确性构成威胁。此外,用户行为的多样性和复杂性使得提取有意义的模式和洞察变得困难。最后,随着电子商务环境的快速变化,数据集需要不断更新以反映最新的市场动态和用户行为趋势。
常用场景
经典使用场景
在电子商务领域,eCommerce数据集的经典使用场景主要集中在网站活动分析、用户行为洞察以及营销效果评估。通过该数据集,研究者和分析师能够深入挖掘用户在网站上的互动行为,如页面浏览、产品点击、购物车操作等,从而为优化用户体验和提升转化率提供数据支持。此外,该数据集还支持对特定时间段内的收入和交易进行详细分析,帮助企业识别高收益时段和潜在的增长点。
解决学术问题
eCommerce数据集在学术研究中解决了多个关键问题,特别是在用户行为分析和电子商务优化领域。通过分析用户会话数据,研究者能够量化用户在网站上的行为模式,如跳出率、页面停留时间等,从而揭示用户满意度和网站性能之间的关系。此外,该数据集还为研究电子商务推荐系统、个性化营销策略提供了丰富的数据基础,推动了相关领域的理论和实践发展。
衍生相关工作
基于eCommerce数据集,衍生了一系列经典工作,涵盖了用户行为建模、推荐系统优化和营销策略分析等多个领域。例如,有研究利用该数据集开发了基于用户行为序列的预测模型,用于个性化推荐和动态定价。此外,还有工作探讨了如何通过数据分析优化购物车和结账流程,提升用户转化率。这些衍生工作不仅丰富了电子商务领域的研究内容,也为实际应用提供了有力的技术支持。
以上内容由遇见数据集搜集并总结生成



