five

COVID-19 Dataset

收藏
github2024-01-13 更新2024-05-31 收录
下载链接:
https://github.com/Milanowicz/COVID-19-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于数据科学研究,包含来自约翰霍普金斯大学和德国罗伯特·科赫研究所的COVID-19疫情数据。数据集详细记录了各州/国家的每日确诊病例、死亡病例等关键信息,适用于疫情分析和研究。

This dataset is designed for data science research, encompassing COVID-19 pandemic data from Johns Hopkins University and the Robert Koch Institute in Germany. It meticulously records daily confirmed cases, deaths, and other critical information by state/country, making it suitable for pandemic analysis and research.
创建时间:
2020-03-25
原始信息汇总

COVID-19 Dataset 概述

数据集来源与用途

  • 用途:用于数据科学研究。
  • 数据源
    • 德国数据:来自Robert Koch-Institut (RKI)。
    • 全球数据:来自Johns Hopkins University (JHU)。

德国数据详情

  • 列描述
    • State:德国联邦州名称。
    • Date:日期,格式为%Y-%m-%d。
    • Confirmed:确诊病例数。
    • Deaths:死亡病例数。

全球数据详情

  • 数据文件
    • time_series_covid19_confirmed_deaths_recovered.csv

      • 列描述
        • City:城市名称。
        • State:联邦州名称。
        • Country:国家名称。
        • Date:日期,格式为%Y-%m-%d。
        • Latitude:纬度。
        • Longitude:经度。
        • Confirmed:确诊病例数。
        • Deaths:死亡病例数。
        • Recovered:康复病例数。
        • Active:活跃病例数(=Confirmed - Deaths - Recovered)。
        • WHO Region:世界卫生组织区域。
    • time_series_covid19_grouped_day_country.csv

      • 列描述
        • Date:日期,格式为%Y-%m-%d。
        • Country:国家名称。
        • Confirmed:确诊病例数。
        • Deaths:死亡病例数。
        • Recovered:康复病例数。
        • Active:活跃病例数(=Confirmed - Deaths - Recovered)。
        • New cases:每日新增病例数。
        • New deaths:每日新增死亡病例数。
        • New recovered:每日新增康复病例数。
        • WHO Region:世界卫生组织区域。
    • time_series_covid19_grouped_by_countries.csv

      • 列描述
        • Country:国家名称。
        • Confirmed:确诊病例数。
        • Deaths:死亡病例数。
        • Recovered:康复病例数。
        • Active:活跃病例数(=Confirmed - Deaths - Recovered)。
        • New cases:每日新增病例数。
        • New deaths:每日新增死亡病例数。
        • New recovered:每日新增康复病例数。
        • Deaths / 100 Cases:每100例病例中的死亡数。
        • Recovered / 100 Cases:每100例病例中的康复数。
        • Deaths / 100 Recovered:每100例康复中的死亡数。
        • Confirmed last week:上周确诊病例数。
        • 1 week change:一周变化。
        • 1 week % increase:一周增长率。
        • WHO Region:世界卫生组织区域。
    • time_series_covid19_grouped_by_days.csv

      • 列描述
        • Date:日期,格式为%Y-%m-%d。
        • Confirmed:确诊病例数。
        • Deaths:死亡病例数。
        • Recovered:康复病例数。
        • Active:活跃病例数(=Confirmed - Deaths - Recovered)。
        • New cases:每日新增病例数。
        • New deaths:每日新增死亡病例数。
        • New recovered:每日新增康复病例数。
        • Deaths / 100 Cases:每100例病例中的死亡数。
        • Recovered / 100 Cases:每100例病例中的康复数。
        • Deaths / 100 Recovered:每100例康复中的死亡数。
        • Country Number:国家编号。

人口数据

  • 数据描述:包含不同国家/地区从1960至2018年的总人口数据。
  • 数据类型:压缩数据和区域数据。
  • 数据来源:https://data.worldbank.org/indicator/SP.POP.TOTL

以上为COVID-19数据集的详细描述。

搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19数据集通过整合来自德国罗伯特·科赫研究所(RKI)和约翰斯·霍普金斯大学(JHU)的公开数据构建而成。数据集涵盖了全球范围内的COVID-19病例数据,包括每日新增确诊、死亡和康复病例的详细记录。数据以CSV格式存储,便于使用Pandas等工具进行加载和分析。此外,数据集还包含了1960年至2018年间的全球人口数据,为研究提供了更广泛的人口统计学背景。
特点
该数据集的特点在于其全面性和多样性。它不仅提供了德国各联邦州的详细病例数据,还涵盖了全球范围内的城市、州、国家层面的疫情信息。数据集中的每一列都经过精心设计,确保数据的一致性和可操作性。例如,每日新增病例、死亡和康复数据均以标准化的日期格式记录,便于时间序列分析。此外,数据集还包含了地理坐标和世界卫生组织(WHO)区域信息,为空间分析和区域比较提供了便利。
使用方法
使用该数据集时,用户可以通过Pandas库轻松加载CSV文件,进行数据清洗、分析和可视化。数据集提供了多种分组方式,如按日、按国家或按全球汇总,用户可以根据研究需求选择合适的数据子集。此外,数据集还附带了Python环境安装脚本和数据更新脚本,确保用户能够获取最新的疫情数据。通过结合人口数据,用户可以进行更深入的流行病学分析,探索疫情与人口结构之间的关系。
背景与挑战
背景概述
COVID-19数据集由Milanowicz于2020年创建,旨在为数据科学领域提供关于COVID-19疫情的详细数据。该数据集整合了来自德国罗伯特·科赫研究所(RKI)和约翰斯·霍普金斯大学(JHU)的全球疫情数据,涵盖了确诊病例、死亡病例、康复病例等关键指标。数据集的结构设计便于使用Pandas等工具进行数据加载和分析,为研究人员提供了全球范围内疫情动态的全面视角。该数据集的发布为流行病学、公共卫生政策制定以及疫情预测模型的研究提供了重要支持,极大地推动了相关领域的研究进展。
当前挑战
COVID-19数据集在构建过程中面临多重挑战。首先,数据来源的多样性和数据格式的不一致性增加了数据整合的难度,需要开发复杂的脚本以确保数据的准确性和一致性。其次,疫情数据的实时更新要求数据集必须频繁同步,这对数据采集和处理的自动化提出了较高要求。此外,全球各国和地区的数据报告标准不一,导致部分数据的完整性和可靠性难以保证。在应用层面,如何从海量数据中提取有价值的信息,并构建有效的预测模型,仍是研究人员面临的主要挑战。这些问题的解决需要跨学科的合作与技术创新。
常用场景
经典使用场景
COVID-19数据集广泛应用于流行病学研究和公共卫生政策制定。该数据集通过整合来自德国罗伯特·科赫研究所(RKI)和约翰斯·霍普金斯大学(JHU)的全球疫情数据,为研究人员提供了详细的病例、死亡和康复信息。这些数据通常用于构建疫情传播模型,预测未来趋势,并评估不同干预措施的效果。
解决学术问题
COVID-19数据集解决了疫情数据标准化和全球比较的难题。通过提供统一的格式和详细的分类信息,研究人员能够更准确地分析疫情在不同地区和时间段的变化。该数据集还为研究疫情传播动力学、病毒变异影响以及公共卫生政策效果提供了重要支持,推动了流行病学领域的学术进展。
衍生相关工作
基于COVID-19数据集,许多经典研究工作得以展开。例如,研究人员开发了多种疫情预测模型,如基于机器学习的传播预测算法和基于统计学的风险评估模型。此外,该数据集还催生了多篇高影响力的学术论文,探讨了疫情对社会经济、医疗系统和全球化的深远影响,进一步丰富了相关领域的研究成果。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作