World Mortality Dataset|全球死亡率数据集|公共卫生数据集

github2024-05-23 更新2024-05-31 收录

全球死亡率

公共卫生

下载链接：

https://github.com/akarlinsky/world_mortality

下载链接

链接失效反馈

资源简介：

该数据集包含2015至2024年间各国全因死亡率数据，涵盖127个国家和地区，数据来源于多种渠道。数据集提供全因死亡总数，不区分年龄或性别，且仅提供国家级别的数据。此外，数据集还整合了人类死亡率数据库的短期死亡率波动数据。

This dataset encompasses all-cause mortality data from 2015 to 2024 across 127 countries and regions, sourced from various channels. It provides the total number of all-cause deaths without distinguishing by age or gender, and only offers data at the national level. Additionally, the dataset integrates short-term mortality fluctuation data from the Human Mortality Database.

创建时间：

2021-01-10

原始信息汇总

World Mortality Dataset 概述

数据集描述

名称: World Mortality Dataset
时间范围: 2015–2024
覆盖地区: 127个国家及地区
数据类型: 国家级别的所有原因死亡数据
更新频率: 数据持续更新

数据内容

死亡类型: 所有原因死亡数据
数据粒度: 每周、每月或季度数据
数据范围: 仅提供国家级别数据，不细分年龄或性别

数据来源

主要来源:
- Human Mortality Database, Short-Term Mortality Fluctuations (STMF)
- Eurostat
其他来源: 各国统计局或相关部门的直接数据请求

数据处理

数据集成: 将STMF数据与Eurostat数据进行协调，优先使用STMF数据
数据质量: 最新数据点为初步数据，可能会有较大修订
数据排除: 排除明显不完整的最新周数据

数据使用

引用方式: Karlinsky & Kobak 2021, Tracking excess mortality across countries during the COVID-19 pandemic with the World Mortality Dataset, eLife
相关分析: 使用此数据集进行的超额死亡分析可见于 https://github.com/dkobak/excess-mortality

数据局限

未来预测: 从2024年起将不再提供超额死亡估计，因为基于2015–2019趋势的线性外推法随时间推移越来越不可靠
数据要求: 至少需要完整2019年的数据，且数据必须至少更新至2020年6月

数据贡献

贡献欢迎: 欢迎任何形式的贡献

以上概述了World Mortality Dataset的关键信息，包括数据集的基本描述、内容、来源、处理方式、使用方法及局限性。

AI搜集汇总

数据集介绍

构建方式

世界死亡率数据集（World Mortality Dataset）的构建基于对2015年至2024年间全球127个国家和地区全因死亡率的全面收集。数据来源包括人类死亡率数据库（Human Mortality Database, HMD）的短期死亡率波动数据（Short-Term Mortality Fluctuations, STMF）、欧洲统计局（EuroStat）以及其他国家统计机构的官方发布。数据收集涵盖了每周、每月和每季度的死亡率数据，确保了时间序列的连续性和完整性。此外，数据集还整合了来自不同国家和地区的初步数据，这些数据在后续可能会进行修订，以反映最新的统计结果。

特点

世界死亡率数据集的一个显著特点是其广泛的地理覆盖范围，涵盖了全球127个国家和地区，提供了详尽的全因死亡率数据。数据集不仅包括了传统的死亡率统计，还特别关注了COVID-19大流行期间的死亡率变化，为研究超额死亡率提供了宝贵的数据支持。此外，数据集的更新频率高，能够及时反映各国的死亡率动态，特别是对于最新数据的初步性质，确保了研究的前沿性和时效性。

使用方法

世界死亡率数据集适用于多种研究目的，包括但不限于公共卫生研究、流行病学分析、社会学研究以及政策制定。研究者可以通过下载数据集，利用统计软件进行数据分析，探索不同国家和地区的死亡率趋势及其影响因素。特别地，数据集对于研究COVID-19大流行对全球死亡率的影响具有重要价值。在使用数据集时，研究者应遵循数据引用规范，确保数据的正确使用和学术诚信。

背景与挑战

背景概述

世界死亡率数据集（World Mortality Dataset）由Karlinsky与Kobak于2021年创建，旨在追踪全球各国在COVID-19大流行期间的过量死亡情况。该数据集涵盖了2015至2024年间127个国家和地区的全因死亡率数据，主要来源于多个权威统计机构。其核心研究问题在于通过量化和分析过量死亡，揭示疫情对全球健康系统的深远影响。这一数据集不仅为公共卫生研究提供了宝贵的资源，还为政策制定者提供了关键的决策依据，推动了全球范围内对疫情影响的深入理解。

当前挑战

世界死亡率数据集在构建过程中面临多重挑战。首先，数据来源的多样性和不一致性导致数据整合的复杂性增加。其次，部分国家提供的最新数据存在初步性和易变性，需要频繁更新和校正。此外，数据集仅提供全因死亡总数，未细分年龄和性别，限制了更精细的分析。最后，由于数据仅限于国家层面，无法进一步细分为地区或城市，这限制了地方层面的研究应用。这些挑战要求研究者在数据处理和分析过程中保持高度的谨慎和专业性。

常用场景

经典使用场景

世界死亡率数据集（World Mortality Dataset）广泛应用于全球范围内的死亡率趋势分析。该数据集提供了2015年至2024年间127个国家和地区的全因死亡率数据，为研究人员提供了宝贵的资源。经典使用场景包括：通过分析不同国家和地区的死亡率数据，评估全球健康状况的变化趋势，特别是在重大公共卫生事件如COVID-19疫情期间，该数据集成为研究超额死亡率的重要工具。

实际应用

在实际应用中，世界死亡率数据集被广泛用于公共卫生监测和政策制定。例如，政府和国际组织利用该数据集来监测和评估全球健康状况，制定针对性的公共卫生策略。此外，保险公司和医疗机构也利用这些数据来评估风险和制定保险政策。在学术界，该数据集为研究人员提供了丰富的数据资源，支持多种健康相关研究，包括流行病学、社会学和经济学等领域的交叉研究。

衍生相关工作

世界死亡率数据集的发布催生了一系列相关的经典工作。例如，Karlinsky & Kobak 2021年的研究利用该数据集分析了COVID-19疫情期间的超额死亡率，发表在《eLife》杂志上。此外，该数据集还支持了多个子项目，如地方性死亡率数据的收集和分析，进一步扩展了其应用范围。这些衍生工作不仅丰富了全球健康研究的工具库，也为未来的研究提供了新的方向和方法。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

hoskinson-center/proof-pile

`proof-pile`是一个13GB的数学文本预训练数据集，包含83亿个标记（使用`gpt-neox`分词器）。该数据集由多种非正式和正式数学文本来源组成，包括ArXiv.math（10GB）、开源数学教科书（50MB）、形式数学库（500MB）、Math Overflow和Math Stack Exchange（2.5GB）、Wiki风格来源（50MB）以及MATH数据集（6MB）。数据集构建过程可复现，并提供了详细的预处理步骤和过滤条件。

hugging_face 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估，我们引入了一个新颖且全面的数据集，专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集，包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象，以实现强大的检测和分类。

github 收录

Maddison Project Database

The Maddison Project Database was started in March 2010. The project builds on the original dataset created by economist Agnus Maddison to revise or adjust the historical economic data based on new information. Data for population, GDP, and per capita GDP are presented by countries, small country groups, regions, and the world, dating back to Roman times. In the January 2013 update many of the pre-1820 and all of the pre-1600 numbers for GDP per capita were modified. GDP per capita data for 2009 and 2010 were also added.

Global Health Data Exchange () 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源，是提供人类基本需求和基本社会保障的先决条件；也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础，兼具学术、经济、社会等多种价值。本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分（含胆固醇）数据，657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心收录

NIST Thermochemical Database

NIST Thermochemical Database（NIST热化学数据库）是一个包含大量热化学数据的数据集，涵盖了各种化学物质的热力学性质，如焓、熵、自由能等。该数据库由美国国家标准与技术研究院（NIST）维护，旨在为科学研究和工业应用提供准确的热化学数据。

webbook.nist.gov 收录