five

Covid-19-Preprocessed-Dataset

收藏
github2024-01-11 更新2024-05-31 收录
下载链接:
https://github.com/laxmimerit/Covid-19-Preprocessed-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
包含全球范围内COVID-19的时间序列数据,记录了确诊病例、报告死亡和报告康复的人数,数据按国家和子区域细分。

This dataset encompasses time-series data on COVID-19 globally, documenting the number of confirmed cases, reported deaths, and reported recoveries, with data segmented by country and sub-region.
创建时间:
2022-01-10
原始信息汇总

数据集概述

数据集名称

Covid-19-Preprocessed-Dataset

数据内容

该数据集包含COVID-19疫情的时间序列数据,具体包括:

  • 确认的冠状病毒感染病例数
  • 报告的因冠状病毒病死亡的人数
  • 报告的从冠状病毒病中恢复的人数

数据格式

CSV格式,每日更新。

数据来源

数据来源于Johns Hopkins University Center for Systems Science and Engineering维护的上游仓库

数据源详情

  • World Health Organization (WHO)
  • DXY.cn
  • BNO News
  • National Health Commission of the People’s Republic of China (NHC)
  • China CDC (CCDC)
  • Hong Kong Department of Health
  • Macau Government
  • Taiwan CDC
  • US CDC
  • Government of Canada
  • Australia Government Department of Health
  • European Centre for Disease Prevention and Control (ECDC)
  • Ministry of Health Singapore (MOH)
  • Italy Ministry of Health

数据使用注意事项

  • 数据报告至2020年7月较为准确,建议探索范围为2020年1月至2020年7月。
  • 由于部分国家停止报告COVID数据,且存在数据源间的差异,部分计算如活跃病例和基于恢复的比率可能不准确。
搜集汇总
数据集介绍
main_image_url
构建方式
Covid-19-Preprocessed-Dataset的构建基于全球范围内的COVID-19时间序列数据,涵盖了确诊病例、死亡病例和康复病例的详细记录。数据来源于约翰斯·霍普金斯大学系统科学与工程中心(CSSE)维护的上游仓库,该仓库整合了世界卫生组织(WHO)、各国卫生部门及其他权威机构的数据。数据集以CSV格式存储,每日更新,确保了数据的时效性和广泛性。
特点
该数据集的特点在于其全面性和细粒度。数据按国家和次区域进行划分,提供了全球范围内的COVID-19疫情动态。数据集不仅包含每日的确诊、死亡和康复病例数,还通过预处理步骤对数据进行了清洗和整理,确保了数据的准确性和一致性。此外,数据集还提供了按日期、国家和全球汇总的多种视图,便于用户进行多维度的分析。
使用方法
使用Covid-19-Preprocessed-Dataset时,用户可以通过Python等编程语言加载CSV文件,并利用Pandas等数据处理工具进行数据分析和可视化。数据集提供了多个预处理后的文件,如按日期汇总的全球数据、按国家汇总的每日数据等,用户可以根据需求选择合适的数据文件进行分析。通过Plotly等可视化库,用户可以生成疫情趋势图、地图等直观的图表,帮助更好地理解疫情的发展态势。
背景与挑战
背景概述
Covid-19-Preprocessed-Dataset 是一个针对全球新型冠状病毒肺炎(COVID-19)疫情的时间序列数据集,记录了确诊病例、死亡病例和康复病例的数量,并按国家和地区进行细分。该数据集由约翰斯·霍普金斯大学系统科学与工程中心(CSSE)维护,数据来源于世界卫生组织(WHO)、各国卫生部门及其他权威机构。自2020年3月11日世界卫生组织宣布COVID-19为全球大流行以来,该数据集为全球范围内的疫情监测、政策制定和科学研究提供了重要支持。其核心研究问题在于通过数据驱动的分析方法,揭示疫情的传播规律、预测发展趋势,并为公共卫生决策提供科学依据。
当前挑战
Covid-19-Preprocessed-Dataset 在解决疫情数据分析问题时面临多重挑战。首先,数据来源的多样性和不一致性导致数据质量难以保证,部分国家和地区的数据报告存在延迟或缺失。其次,康复病例的计算依赖于确诊病例和死亡病例,但由于各国对康复标准的定义不同,康复数据的准确性受到质疑。此外,随着部分国家停止报告疫情数据,数据集的完整性和时效性进一步受到影响。在构建过程中,研究人员还需应对数据清洗、格式统一和跨源数据整合等技术难题,以确保数据的可靠性和可用性。这些挑战不仅影响了数据集的直接应用,也对基于该数据集的科学研究提出了更高的要求。
常用场景
经典使用场景
Covid-19-Preprocessed-Dataset广泛应用于全球范围内的疫情数据分析与研究。该数据集通过时间序列数据,详细记录了各国及地区的确诊病例、死亡病例和康复病例,为研究人员提供了全面的疫情动态追踪工具。经典使用场景包括疫情趋势预测、病毒传播模型构建以及公共卫生政策效果评估。
衍生相关工作
基于Covid-19-Preprocessed-Dataset,衍生了许多经典研究工作。例如,研究人员利用该数据集开发了多种疫情预测模型,如基于机器学习的传播预测模型和基于统计学的趋势分析模型。此外,该数据集还支持了多项关于病毒变异、疫苗效果评估以及社会行为对疫情影响的跨学科研究,为全球疫情防控提供了科学依据。
数据集最近研究
最新研究方向
在全球公共卫生领域,COVID-19疫情数据的收集与分析一直是研究热点。Covid-19-Preprocessed-Dataset作为一项重要的预处理数据集,为研究者提供了全球范围内确诊病例、死亡病例和康复病例的时间序列数据。当前,该数据集的研究方向主要集中在疫情传播模型的构建与优化、疫苗分配策略的评估以及公共卫生政策的有效性分析。特别是在疫情后期,研究者们更加关注数据的准确性与一致性,以应对部分国家停止报告数据或数据来源不一致的挑战。此外,该数据集还被广泛应用于机器学习模型的训练,以预测疫情发展趋势和评估干预措施的效果。这些研究不仅为全球疫情防控提供了科学依据,也为未来应对类似公共卫生事件积累了宝贵经验。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作