Gapminder and Google Covid19 Datasets
收藏github2025-01-16 更新2025-01-17 收录
下载链接:
https://github.com/lauramartinazure/PowerBI_Masterclass_Series
下载链接
链接失效反馈官方服务:
资源简介:
数据集来自Gapminder和Google Covid19数据集。Gapminder数据集包括儿童死亡率、出生率、死亡率、人均健康支出、健康支出占GDP的百分比、女性预期寿命、男性预期寿命等。Google Covid19数据集包括地理数据、健康数据和疫苗接种数据。
The datasets are sourced from the Gapminder and Google COVID-19 datasets. The Gapminder dataset covers indicators including child mortality rate, birth rate, crude death rate, per capita health expenditure, the proportion of health expenditure in GDP, life expectancy at birth for females, life expectancy at birth for males, and so on. The Google COVID-19 dataset includes geographic data, health-related data, and vaccination data.
创建时间:
2024-12-31
原始信息汇总
PowerBI_Masterclass_Series 数据集概述
数据集来源
- Gapminder: 提供儿童死亡率、出生率、死亡率、健康支出等数据。
- 数据链接: Gapminder
- Google Covid19 Datasets: 提供地理数据、健康数据和疫苗接种数据。
- 数据链接: Google Covid19 Datasets
数据集内容
Gapminder 数据集
- 儿童死亡率(0-5岁)
- 每1000人口的粗出生率
- 每1000人口的粗死亡率
- 人均健康支出(美元)
- 健康支出占GDP的百分比
- 女性预期寿命
- 男性预期寿命
Google Covid19 数据集
- 地理数据:
- 地理层级结构:
- 0: 国家
- 1: 省、州或等效地区
- 2: 市、县或等效地区
- 3: 可能不符合既定层级类别的地区(例如,城市可能跨越多个市)
- 位置键由其层级决定:
- 国家级别数据:US
- 州级别数据:US_CA
- 县级别数据:US_CA_06085
- 城市级别数据:US_CA_SFO
- 地理层级结构:
- 健康数据
- 疫苗接种数据(来自URL和Azure云存储演示)
- 元数据
数据集使用场景
- Session 1: 数据加载与准备
- 加载单个CSV文件
- 从文件夹加载多个文件(如果它们具有相同的结构)
- 从URL加载数据
- 从云存储(Azure云存储)加载数据
- 从API加载数据(REST countries)
- Session 2: 数据建模与基本可视化
- 数据建模原则
- 创建/删除数据关系
- 基本可视化创建
- Session 3: 高级可视化与报告优化
- 创建视觉冲击力强的报告
- 使用DAX创建高级度量
- 自定义视觉效果和使用Python
数据集获取方式
- 通过GIT:
- 下载并安装GIT
- 使用
git clone命令克隆仓库
- 通过ZIP文件:
- 直接下载仓库内容并解压
系统要求
- 操作系统: Windows(PowerBI不支持Mac)
- 软件: 需要安装Microsoft PowerBI
- 下载链接: Microsoft PowerBI
搜集汇总
数据集介绍

构建方式
Gapminder and Google Covid19 Datasets的构建基于两个主要数据源:Gapminder和Google Covid19开放数据。Gapminder提供了包括儿童死亡率、出生率、死亡率、健康支出及预期寿命等全球健康指标数据。Google Covid19数据集则涵盖了地理层级数据、健康数据和疫苗接种数据,地理数据按国家、省/州、市/县等层级进行组织,并采用特定的位置键标识。数据集的整合通过PowerBI工具完成,支持从CSV文件、文件夹、URL、云存储及API等多种方式加载数据。
特点
该数据集的特点在于其多维度的健康与地理数据整合,涵盖了从全球到地方层级的详细信息。Gapminder数据提供了长期的历史健康指标,便于分析全球健康趋势;Google Covid19数据则聚焦于疫情相关的实时数据,包括疫苗接种和地理分布。数据集的地理层级结构设计精细,支持从国家到具体城市的逐级分析。此外,数据集的格式兼容性强,便于通过PowerBI进行数据建模、可视化和高级分析。
使用方法
该数据集的使用方法主要围绕PowerBI工具展开。用户可通过PowerBI加载数据集,进行数据清洗、建模和可视化操作。数据加载支持多种方式,包括从CSV文件、文件夹、URL、云存储及API获取数据。在数据建模阶段,用户可创建数据关系、设计中央日期/位置表,并利用DAX语言创建度量值。可视化部分提供了丰富的图表类型和自定义选项,支持地图、工具提示等高级功能。最终,用户可将报告发布至PowerBI工作区,实现数据共享与协作。
背景与挑战
背景概述
Gapminder与Google Covid19数据集是由Gapminder基金会和Google健康部门共同构建的综合性数据集,旨在为全球健康与发展研究提供数据支持。Gapminder数据集涵盖了儿童死亡率、出生率、死亡率、健康支出、人均GDP、男女预期寿命等关键指标,数据来源广泛且时间跨度较长,为全球健康趋势分析提供了重要依据。Google Covid19数据集则聚焦于新冠疫情的地理分布、健康数据和疫苗接种情况,数据层次分明,涵盖国家、省/州、市/县等多个层级,为疫情监测与防控提供了精准的数据支持。这两个数据集的结合为研究人员提供了多维度的全球健康数据分析工具,推动了公共卫生领域的深入研究。
当前挑战
Gapminder与Google Covid19数据集在应用过程中面临多重挑战。首先,数据整合与清洗的复杂性较高,尤其是Google Covid19数据集的地理层级结构复杂,不同层级的数据嵌套关系需要精确处理,以确保分析的准确性。其次,数据来源的多样性和格式差异增加了数据预处理的难度,例如Gapminder数据集中的指标涉及多个国家和时间点,数据缺失和不一致性较为常见。此外,Google Covid19数据集中的疫苗接种数据需要实时更新,这对数据存储和计算资源提出了较高要求。最后,如何将这两个数据集有效结合,构建统一的分析框架,也是研究人员需要解决的关键问题。
常用场景
经典使用场景
Gapminder和Google Covid19数据集在数据科学和公共卫生研究中扮演着关键角色。这些数据集常用于分析全球健康趋势,如儿童死亡率、出生率和死亡率等,以及COVID-19疫情的地理分布和疫苗接种情况。通过PowerBI等工具,研究人员能够有效地加载、清洗和可视化这些复杂的数据,从而揭示出重要的公共卫生洞察。
实际应用
在实际应用中,Gapminder和Google Covid19数据集被广泛用于政府和国际组织的决策支持系统。例如,世界卫生组织和各国卫生部利用这些数据来监控疫情发展,优化资源分配,并制定针对性的疫苗接种策略。此外,这些数据也支持了学术研究和公共健康教育的开展。
衍生相关工作
基于Gapminder和Google Covid19数据集,已经衍生出多项经典研究工作。例如,利用这些数据进行的全球健康不平等研究,揭示了不同国家和地区在健康资源分配上的差异。此外,还有研究利用这些数据集开发了预测模型,用于预测疫情发展趋势和评估防控措施的有效性。
以上内容由遇见数据集搜集并总结生成



