COVID-19 Dataset

github2022-01-11 更新2024-05-31 收录

下载链接：

https://github.com/TuTomasz/Covid19-Dataset

下载链接

链接失效反馈

资源简介：

该数据集包含全球新冠病毒统计数据，以JSON格式提供，数据来源为约翰斯·霍普金斯大学系统科学与工程中心。数据集自动更新，确保与原始数据源同步，并提供额外的统计信息。

This dataset encompasses global COVID-19 statistics, provided in JSON format, sourced from the Center for Systems Science and Engineering at Johns Hopkins University. The dataset is automatically updated to ensure synchronization with the original data source and includes additional statistical information.

创建时间：

2020-03-28

原始信息汇总

COVID-19 Dataset 概述

数据集描述

本项目将Johns Hopkins CSSE的2019 Novel Coronavirus COVID-19 (2019-nCoV)数据仓库中的CSV格式数据转换为JSON格式，并计划添加更多字段和统计数据。数据会自动定时更新，确保与原始数据源同步。

数据格式

全球每日数据

日期：关注的日期
全球感染总数：全球感染人数
全球康复总数：全球康复人数
全球死亡总数：全球死亡人数
新增病例：自前一天以来的新增病例数
新增死亡：自前一天以来的新增死亡数
每小时死亡数：每小时死亡人数
感染百分比：基于全球人口的感染百分比
康复百分比：基于全球人口的康复百分比
死亡百分比：基于全球人口的死亡百分比
翻倍率：病毒翻倍的天数（5天滚动周期）
死亡率：关注的国家的当前死亡率

美国每日数据

日期：关注的日期
州感染总数：特定州的感染人数
州死亡总数：特定州的死亡人数
州总人口：州的全部人口
新增病例：特定州自前一天以来的新增病例数
新增死亡：特定州自前一天以来的新增死亡数
每小时死亡数：每小时死亡人数
感染百分比：基于州人口的感染百分比
死亡百分比：基于州人口的死亡百分比
翻倍率：病毒翻倍的天数（5天滚动周期）
死亡率：关注的州的当前死亡率

数据集链接

全球数据集：http://tiny.cc/Covid-19-global
美国数据集：http://tiny.cc/Covid-19-usa

搜集汇总

数据集介绍

构建方式

COVID-19数据集通过自动化流程从约翰霍普金斯大学系统科学与工程中心（JHU CSSE）的2019新型冠状病毒（COVID-19）数据仓库中提取CSV格式数据，并将其转换为JSON格式。该数据集包含全球和美国的每日疫情数据，如感染总数、康复总数、死亡总数等关键指标。数据通过定期自动更新，确保与原始数据源保持同步，从而提供最新的疫情动态。

特点

该数据集的特点在于其全面性和实时性。它不仅提供了全球范围内的疫情统计数据，还详细记录了美国各州的疫情发展情况。数据集中的每个条目都包含了丰富的统计指标，如新增病例数、新增死亡数、每小时死亡数、感染率、死亡率等，这些数据为研究人员和政策制定者提供了宝贵的参考信息。此外，数据的JSON格式设计使得其易于解析和集成到各种分析工具中。

使用方法

使用COVID-19数据集时，用户可以通过提供的URL直接访问全球或美国的疫情数据。数据集支持多种编程语言进行数据获取，如JavaScript和Python。用户可以通过简单的API调用，获取特定日期或地区的疫情数据，并进行进一步的分析或可视化。例如，使用JavaScript的fetch函数可以轻松获取全球数据，而Python的urllib3库则可用于获取并解析JSON格式的数据。这些方法使得数据集的使用既灵活又高效。

背景与挑战

背景概述

COVID-19数据集由约翰斯·霍普金斯大学系统科学与工程中心（JHU CSSE）于2020年初创建，旨在为全球研究人员提供关于新型冠状病毒（COVID-19）疫情的实时数据。该数据集通过自动更新机制，确保数据的时效性，涵盖了全球及美国各州的感染、康复和死亡病例的详细统计信息。其核心研究问题在于通过数据驱动的分析，帮助理解疫情的传播动态、评估防控措施的效果，并为公共卫生决策提供科学依据。该数据集在疫情期间被广泛应用于流行病学建模、政策制定和公众信息传播，对全球抗疫工作产生了深远影响。

当前挑战

COVID-19数据集在解决疫情数据可视化和分析方面面临多重挑战。首先，数据的实时性和准确性至关重要，但由于不同国家和地区的报告标准不一致，数据整合和清洗成为一大难题。其次，疫情数据的动态变化要求数据集具备高效的更新机制，以确保信息的及时性。此外，数据格式的转换（如从CSV到JSON）和统计指标的扩展（如感染率、死亡率等）增加了数据处理的复杂性。在构建过程中，研究人员还需应对数据源的多样性和异构性，确保数据的完整性和一致性，这对数据工程和算法设计提出了更高的要求。

常用场景

经典使用场景

COVID-19数据集在全球范围内被广泛用于追踪和分析新冠病毒的传播动态。研究人员利用该数据集中的每日感染、康复和死亡数据，构建时间序列模型，预测疫情发展趋势。此外，该数据集还被用于分析不同国家和地区的疫情响应措施对病毒传播的影响，为公共卫生政策的制定提供数据支持。

实际应用

在实际应用中，COVID-19数据集被广泛应用于政府和公共卫生机构的决策支持系统中。例如，美国各州政府利用该数据集中的州级数据，实时监控疫情发展，调整防控策略。此外，医疗机构也利用这些数据优化资源配置，确保医疗资源的合理分配，以应对疫情高峰期的需求。

衍生相关工作

基于COVID-19数据集，许多经典研究工作得以展开。例如，研究人员开发了多种疫情预测模型，如基于机器学习的传播预测算法和基于统计学的死亡率分析模型。此外，该数据集还催生了许多可视化工具和平台，帮助公众更直观地理解疫情发展态势，增强了信息的透明度和传播效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集