ebola_outbreak_dataset
收藏github2020-05-24 更新2024-05-31 收录
下载链接:
https://github.com/imdevskp/ebola_outbreak_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了2014年埃博拉疫情爆发的数据,包括原始数据和清洗后的数据。数据涵盖了多种指标,如累计和近期的确认、可能和疑似病例数,以及死亡数等。
This dataset encompasses data from the 2014 Ebola outbreak, including both raw and cleaned data. It covers a variety of metrics such as cumulative and recent confirmed, probable, and suspected cases, as well as death counts.
创建时间:
2020-03-09
原始信息汇总
数据集概述
数据集名称
- ebola_outbreak_dataset
数据集来源
- https://data.humdata.org/dataset/ebola-cases-2014
- https://apps.who.int/gho/data/node.ebola-sitrep
数据集文件
- ebola_2014_2016_raw.csv - 包含来自https://data.humdata.org/dataset/ebola-cases-2014的原始数据,包含多个指标。
- ebola_data_cleaning.ipynb - 包含用于清洗数据的代码的笔记本。
- ebola_2014_2016_clean.csv - 仅包含确认和死亡计数的数据。
数据集指标
- 病例数
- 累计确认的埃博拉病例数
- 累计可能的埃博拉病例数
- 累计疑似埃博拉病例数
- 累计确认、可能和疑似埃博拉病例数
- 死亡数
- 累计确认的埃博拉死亡数
- 累计可能的埃博拉死亡数
- 累计疑似埃博拉死亡数
- 累计确认、可能和疑似埃博拉死亡数
- 近期病例数
- 过去21天内确认的埃博拉病例数
- 过去21天内可能的埃博拉病例数
- 过去21天内疑似的埃博拉病例数
- 过去21天内确认、可能和疑似埃博拉病例数
- 过去7天内确认的埃博拉病例数
- 过去7天内可能的埃博拉病例数
- 过去7天内疑似的埃博拉病例数
- 过去7天内确认、可能和疑似埃博拉病例数
- 病例比例
- 过去7天内确认的埃博拉病例比例
- 过去7天内可能的埃博拉病例比例
- 过去7天内疑似的埃博拉病例比例
- 过去7天内确认、可能和疑似埃博拉病例比例
- 过去21天内确认的埃博拉病例比例
- 过去21天内可能的埃博拉病例比例
- 过去21天内疑似的埃博拉病例比例
- 过去21天内确认、可能和疑似埃博拉病例比例
- 死亡比例
- 过去21天内确认的埃博拉死亡比例
- 过去21天内可能的埃博拉死亡比例
- 过去21天内疑似的埃博拉死亡比例
- 过去21天内确认、可能和疑似埃博拉死亡比例
- 病死率
- 确认的埃博拉病例的病死率
- 可能的埃博拉病例的病死率
- 疑似的埃博拉病例的病死率
- 确认、可能和疑似埃博拉病例的病死率
搜集汇总
数据集介绍

构建方式
ebola_outbreak_dataset的构建基于2014年埃博拉疫情的数据收集与整理。数据来源主要包括Humanitarian Data Exchange(HDX)和世界卫生组织(WHO)的公开数据集。通过爬取和清洗这些数据,生成了包含多个指标的原始数据集,并进一步通过数据清洗流程,提取出确认病例和死亡病例的核心数据,最终形成干净、结构化的数据集。
特点
该数据集涵盖了2014年至2016年埃博拉疫情的详细统计数据,包括确认、疑似和可能病例的累计数量,以及相应的死亡数据。此外,数据集还提供了过去7天和21天内的病例和死亡数据,以及病例致死率(CFR)等关键指标。这些多维度的数据为研究埃博拉疫情的传播动态和防控效果提供了丰富的信息支持。
使用方法
用户可以通过加载*ebola_2014_2016_clean.csv*文件直接使用清洗后的数据集。数据集中的每一列对应一个特定指标,便于进行时间序列分析、疫情传播模型构建或公共卫生政策评估。此外,*ebola_data_cleaning.ipynb*文件提供了数据清洗的代码,用户可根据需求进一步调整或扩展数据集。
背景与挑战
背景概述
ebola_outbreak_dataset数据集聚焦于2014年埃博拉病毒疫情的爆发,旨在为研究人员提供关于该疫情的详细数据支持。该数据集由多个来源整合而成,包括来自人道主义数据交换平台(HDX)和世界卫生组织(WHO)的公开数据。数据集的核心研究问题围绕埃博拉疫情的传播动态、病例统计以及死亡率分析展开,为流行病学研究和公共卫生决策提供了重要参考。该数据集的创建不仅填补了埃博拉疫情数据公开化的空白,还为后续的疫情建模、风险评估和干预策略优化奠定了基础。
当前挑战
ebola_outbreak_dataset在解决埃博拉疫情数据分析问题时面临多重挑战。首先,数据来源的多样性和不一致性导致数据整合和清洗过程复杂,需通过专门的代码处理以确保数据质量。其次,疫情数据的实时性和准确性难以保证,尤其是在疫情初期,数据可能存在滞后或缺失。此外,埃博拉病例的分类(如确诊、疑似和可能病例)及其死亡率的计算涉及复杂的统计方法,这对数据分析和建模提出了较高要求。构建过程中,研究人员还需克服数据格式不统一、指标定义模糊等技术难题,以确保数据集的科学性和实用性。
常用场景
经典使用场景
ebola_outbreak_dataset数据集在流行病学研究中具有重要地位,尤其在分析2014年埃博拉病毒爆发的传播动态和死亡率方面。研究人员利用该数据集中的累积病例和死亡数据,结合时间序列分析,能够深入探讨疫情的传播速度和影响范围。此外,该数据集还支持对疫情在不同时间段内的变化趋势进行建模,为公共卫生决策提供科学依据。
衍生相关工作
基于ebola_outbreak_dataset,许多经典研究工作得以展开。例如,研究人员开发了多种疫情传播模型,用于预测埃博拉病毒的传播路径和潜在风险区域。此外,该数据集还催生了多篇关于疫情响应策略和公共卫生干预效果评估的研究论文,为全球范围内的疫情防控提供了宝贵的经验和理论支持。
数据集最近研究
最新研究方向
近年来,ebola_outbreak_dataset在传染病学和公共卫生领域的研究中占据了重要地位。该数据集详细记录了2014年埃博拉疫情的病例和死亡数据,为研究者提供了丰富的时间序列和空间分布信息。当前的研究方向主要集中在利用这些数据进行疫情传播模型的构建与验证,特别是在预测疫情发展趋势和评估防控措施效果方面。此外,该数据集还被用于研究埃博拉病毒的传播动力学,包括病例的时空分布特征和传播链的追踪。这些研究不仅有助于理解埃博拉病毒的传播机制,还为未来类似疫情的防控提供了科学依据。随着大数据和人工智能技术的发展,ebola_outbreak_dataset在疫情预警系统和公共卫生决策支持系统中的应用也日益广泛,显示出其在全球健康安全领域的重要价值。
以上内容由遇见数据集搜集并总结生成



