mers_dataset_collection_cleaning
收藏github2020-05-24 更新2024-05-31 收录
下载链接:
https://github.com/imdevskp/mers_dataset_collection_cleaning
下载链接
链接失效反馈官方服务:
资源简介:
从WHO网站提取的关于中东呼吸综合征冠状病毒的数据集,包含每周数据、清洁后的数据和各国确诊病例数。
A dataset extracted from the WHO website concerning the Middle East Respiratory Syndrome Coronavirus (MERS-CoV), including weekly data, cleaned data, and the number of confirmed cases by country.
创建时间:
2020-03-09
原始信息汇总
mers_dataset_collection_cleaning 数据集概述
数据来源
文件列表
-
weekly.csv
- 包含字段:Year, Week, Saudi Arabia, Republic of Korea, Other Countries
-
weekly_clean.csv
- 包含字段:Year, Week, Region, New Cases
-
country_count_latest
- 包含字段:Country, Confirmed
-
data_cleaning.ipynb
- 描述:用于重塑 weekly.csv 数据的笔记本文件
搜集汇总
数据集介绍

构建方式
mers_dataset_collection_cleaning数据集通过从世界卫生组织(WHO)官方网站提取中东呼吸综合征(MERS)相关数据构建而成。数据源来自WHO的MERS-CoV紧急情况页面,涵盖了全球范围内的MERS病例报告。数据集的核心文件包括weekly.csv和weekly_clean.csv,前者记录了按年份和周数分类的沙特阿拉伯、韩国及其他国家的病例数据,后者则进一步清洗和重塑数据,按区域和新病例数进行整理。此外,数据集还包含一个Jupyter Notebook文件(data_cleaning.ipynb),用于展示数据清洗和重塑的具体过程。
特点
该数据集的特点在于其数据的权威性和时效性,所有数据均直接来源于世界卫生组织,确保了数据的准确性和可靠性。数据集以结构化形式呈现,便于研究人员进行进一步分析和建模。weekly_clean.csv文件通过区域划分和新病例数的整理,为研究MERS的传播模式和区域分布提供了清晰的数据支持。此外,数据清洗过程的透明性通过Jupyter Notebook文件得以体现,使得数据预处理步骤可追溯且易于复现。
使用方法
使用mers_dataset_collection_cleaning数据集时,研究人员可通过weekly.csv文件获取原始的MERS病例数据,了解不同国家和地区的病例分布情况。weekly_clean.csv文件则为区域化分析提供了便利,可直接用于研究MERS的传播动态。数据清洗的Jupyter Notebook文件为数据预处理提供了参考,用户可根据需求调整清洗流程。此外,数据集还可用于构建时间序列模型、区域传播模型或与其他流行病学数据进行对比分析,为公共卫生决策提供科学依据。
背景与挑战
背景概述
mers_dataset_collection_cleaning数据集聚焦于中东呼吸综合症冠状病毒(MERS-CoV)的全球传播情况,数据源自世界卫生组织(WHO)的官方发布。该数据集创建于MERS-CoV疫情爆发期间,旨在为研究人员提供关于疫情传播的详细统计数据,特别是沙特阿拉伯和韩国等主要受影响国家的病例分布。通过整理和清洗原始数据,该数据集为流行病学研究和公共卫生政策制定提供了重要支持,尤其在疫情监测和防控策略优化方面具有显著影响力。
当前挑战
该数据集的核心挑战在于如何准确、高效地处理来自不同国家和地区的疫情数据。由于数据来源的多样性和格式的不一致性,数据清洗和整合过程面临较大难度。此外,确保数据的时效性和准确性也是一个重要挑战,尤其是在疫情快速变化的情况下。构建过程中,研究人员需解决数据缺失、重复记录以及不同国家报告标准不一致等问题,这些都对数据集的完整性和可靠性提出了较高要求。
常用场景
经典使用场景
mers_dataset_collection_cleaning数据集主要用于中东呼吸综合症(MERS)疫情的监测与分析。通过对每周新增病例数据的整理与清洗,研究者能够追踪疫情在不同国家和地区的传播趋势,评估防控措施的效果。该数据集为流行病学研究提供了宝贵的时间序列数据,帮助研究人员深入理解MERS的传播动力学。
解决学术问题
该数据集解决了MERS疫情研究中数据分散、格式不统一的问题。通过提供清洗后的标准化数据,研究者可以更高效地进行跨国比较和区域分析,从而揭示疫情传播的关键驱动因素。此外,数据集的公开共享促进了全球科研合作,为制定科学的公共卫生政策提供了数据支持。
衍生相关工作
基于mers_dataset_collection_cleaning数据集,许多经典研究工作得以展开。例如,研究者利用该数据集开发了MERS传播预测模型,为疫情早期预警提供了技术支持。此外,该数据集还被用于评估不同国家防控政策的有效性,推动了全球公共卫生领域的知识积累与实践创新。
以上内容由遇见数据集搜集并总结生成



