five

COVID-19 Nigeria States Full Dataset

收藏
github2020-05-12 更新2024-05-31 收录
下载链接:
https://github.com/nero1/covid19-nigeria-states-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含尼日利亚各州官方每日COVID-19病例数据,是目前为止尼日利亚最完整的COVID-19数据集。

This dataset comprises the official daily COVID-19 case data for each state in Nigeria, representing the most comprehensive COVID-19 dataset for Nigeria to date.
创建时间:
2020-05-12
原始信息汇总

COVID-19 Nigeria States Full Dataset 概述

数据集描述

  • 数据内容: 包含尼日利亚各州每日COVID-19病例的官方数据。
  • 数据完整性: 据知,这是目前尼日利亚最完整的COVID-19数据集。

数据来源

数据处理

  • 数据格式: 原始数据为PDF格式,转换为CSV格式。
  • 转换方法: 最初尝试自动化转换,但未成功,最终手动完成。
  • 更新频率: 数据需手动更新,最近更新日期为2020年5月9日。

文件结构

  • 文件夹结构: 解压后包含 /PDF/CSV 两个文件夹。
    • /PDF: 存放原始PDF数据文件。
    • /CSV: 存放转换后的CSV格式数据文件,每日数据单独文件,命名格式为 dd_mm_yyyy.csv

缺失数据

  • 缺失日期: 2020年3月20日和2020年3月27日无数据发布。

数据集贡献者

  • 主要贡献者: Tony Areghan, @shirts_ml, datamouse.blogspot.com, NG44 Consulting。
  • 资金支持: NG44 Consulting。
搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19 Nigeria States Full Dataset的构建基于从尼日利亚疾病控制中心(NCDC)获取的官方每日数据。该数据集的构建者将原始的PDF格式数据转换为CSV格式,以增加数据的可访问性和便于自动处理。尽管尝试使用Python中的pandas、selenium和beautifulsoup库自动化提取过程,但未获成功,最终采取了手动提取和更新数据的方式。
使用方法
使用者可以通过访问数据集GitHub页面下载压缩文件,解压后可看到包含PDF和CSV两个文件夹的结构。PDF文件夹包含从NCDC网站下载的原始PDF数据文件,CSV文件夹则包含提取后的每日数据,每个文件按日期命名。对于数据使用过程中的任何反馈,可以通过指定的电子邮件地址与构建者联系。
背景与挑战
背景概述
COVID-19 Nigeria States Full Dataset是一项针对尼日利亚官方每日COVID-19病例数据的研究项目,旨在为数据科学家、统计学家以及机器学习爱好者提供详尽且易于访问的数据资源。该数据集由一群充满热情的数据科学新手创建于2020年5月,数据源于尼日利亚疾病控制中心(NCDC)。它不仅为研究人员提供了宝贵的一手材料,也反映了在公共卫生危机时期,数据共享与开放对于科学研究的至关重要性。
当前挑战
该数据集在构建过程中面临的挑战主要包括:首先,尽管NCDC定期发布数据,但其以PDF格式发布,不利于自动化处理和常见的数据提取工具。其次,研究者尝试使用自动化工具(如pandas结合selenium和beautifulsoup)从PDF文件中提取数据未果,最终不得不采取手动提取的方式,这增加了数据整理的工作量和难度。此外,数据集中还存在着某些日期的数据缺失问题,这对数据的完整性和连续性构成了挑战。
常用场景
经典使用场景
在当前全球卫生状况监测的大背景下,COVID-19 Nigeria States Full Dataset数据集的典型应用场景在于为研究人员提供一个详尽的、按州划分的尼日利亚COVID-19病例官方日常数据。该数据集支持数据科学家、统计学家以及机器学习爱好者在分析疫情动态及寻找解决方案时,能够基于准确和实时的数据集进行工作。
解决学术问题
该数据集解决了尼日利亚地区疫情数据获取难、数据格式不统一等学术研究问题,为学术研究提供了宝贵的一手资料。在疫情数据的时效性、准确性和完整性方面,该数据集满足了学术界对高质量数据的需求,对于流行病学分析、疫情预测模型构建等领域具有重要的研究意义和影响。
实际应用
在实际应用中,COVID-19 Nigeria States Full Dataset数据集可供卫生部门、政策制定者以及公共卫生专家监控疫情发展趋势,评估防疫措施效果,从而更有效地制定和调整公共卫生策略。该数据集对于提升尼日利亚地区乃至全球的疫情应对能力具有显著的应用价值。
数据集最近研究
最新研究方向
在当前全球疫情防控的大背景下,‘COVID-19 Nigeria States Full Dataset’数据集的构建与更新,为研究人员提供了一份详尽的尼日利亚各州COVID-19病例的官方日常数据。该数据集以其完整性,成为当下尼日利亚COVID-19研究中不可或缺的资源。近期,该数据集被广泛用于疾病传播模型构建、疫情预测分析以及公共卫生策略评估等多个研究方向。其不仅促进了数据科学、统计学以及机器学习领域专家对尼日利亚疫情深入分析,也为寻找解决方案提供了数据支撑。在此数据集的支持下,研究人员能够更准确地追踪疫情动态,评估防控措施的效果,进而为尼日利亚乃至全球的疫情防控提供科学依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作