COVID-19 dataset
收藏github2024-05-24 更新2024-05-31 收录
下载链接:
https://github.com/datasets/covid-19
下载链接
链接失效反馈官方服务:
资源简介:
COVID-19数据集包含全球范围内COVID-19确诊病例、报告死亡和报告康复的时间序列数据,数据按国家(有时是子区域)细分。
The COVID-19 dataset encompasses time-series data of confirmed cases, reported deaths, and reported recoveries of COVID-19 globally, segmented by country (and sometimes sub-regions).
创建时间:
2020-03-07
原始信息汇总
数据集概述
数据集名称
COVID-19 dataset
数据内容
- 确认的冠状病毒感染病例
- 报告的冠状病毒相关死亡人数
- 报告的冠状病毒康复人数
数据格式
CSV格式,每日更新
数据来源
- 国际数据源:
- 世界卫生组织 (WHO)
- 欧洲疾病预防控制中心 (ECDC)
- DXY.cn
- 美国疾病控制与预防中心 (US CDC)
- BNO News
- WorldoMeters
- 1Point3Arces
- COVID Tracking Project
- 美国国内数据源:
- 华盛顿州卫生部
- 马里兰州卫生部
- 纽约州卫生部
- 纽约市卫生与心理卫生部
- 佛罗里达州卫生部
- 科罗拉多州
- 弗吉尼亚州
- 北马里亚纳群岛
- 密苏里州卫生部
- 圣路易斯市卫生部
- 圣路易斯县
- 马萨诸塞州
- 密歇根州
- 伊利诺伊州公共卫生部
- 印第安纳州卫生部
- 康涅狄格州公共卫生部
- 俄亥俄州卫生部
- 俄勒冈州卫生局
- 田纳西州卫生部
- 罗德岛州卫生部
- 威斯康星州卫生服务部
- 北卡罗来纳州格林维尔市GIS
- 爱荷华州政府
- 明尼苏达州卫生部
- 阿拉巴马州桑福德大学地理与社会学系
- 密西西比州卫生部
- 内布拉斯加州卫生与人类服务部
- 南卡罗来纳州卫生与环境控制部
- 内华达州卫生与人类服务部
- 新泽西州卫生部
- 非美国国际数据源:
- 中国国家卫生健康委员会 (NHC)
- 中国疾病预防控制中心 (CCDC)
- 香港卫生署
- 澳门政府
- 台湾疾病管制署
- 加拿大政府
- 澳大利亚政府卫生部
- COVID Live (澳大利亚)
- 新加坡卫生部 (MOH)
- 意大利卫生部
- 法国政府
- 巴勒斯坦 (西岸和加沙)
- 以色列
- 科索沃共和国卫生部
- 德国柏林晨邮报
- 西班牙rtve
- 塞尔维亚共和国卫生部
- 智利卫生部
- 巴西卫生部
- 墨西哥政府
- 日本COVID-19冠状病毒追踪器
- 秘鲁国家警察局 - 情报局 (DIRIN) 和秘鲁卫生部
- 哥伦比亚
- 俄罗斯
- 乌克兰
- 瑞典公共卫生局
- 印度卫生和家庭福利部
- 巴基斯坦政府
- 英国政府
- 苏格兰政府
数据处理
使用Pandas处理和标准化数据,包括整理日期和合并多个文件为标准化时间序列。
数据下载
可通过DataHub访问数据、其结构以及下载替代格式(如JSON): https://datahub.io/core/covid-19
许可证
本数据集根据Open Data Commons公共领域和奉献许可证(PDDL)授权。
搜集汇总
数据集介绍

构建方式
该数据集通过整合全球多个权威数据源,包括世界卫生组织(WHO)、欧洲疾病预防控制中心(ECDC)、美国疾病控制与预防中心(CDC)等,构建了一个全面的时间序列数据集。数据由约翰斯·霍普金斯大学系统科学与工程中心(CSSE)团队从全球各地收集,并经过清洗和标准化处理,以确保数据的一致性和准确性。数据集每日更新,涵盖了全球范围内COVID-19的确诊病例、死亡病例和康复病例,并按国家或地区进行细分。
使用方法
用户可以通过访问DataHub网站下载该数据集,支持CSV和JSON等多种格式。数据集的预处理脚本使用Python编写,依赖Pandas库进行数据处理。用户需先安装相关依赖,然后运行指定的Python脚本进行数据处理。数据集的许可证为开放数据公共领域和贡献许可证(PDDL),允许用户自由使用和分发数据。
背景与挑战
背景概述
COVID-19数据集是由约翰斯·霍普金斯大学系统科学与工程中心(CSSE)创建并维护的,旨在追踪全球范围内新型冠状病毒肺炎(COVID-19)的传播情况。该数据集自2020年初开始收集,涵盖了确诊病例、死亡病例和康复病例的时间序列数据,并按国家和地区进行了细分。CSSE团队通过整合来自世界卫生组织(WHO)、欧洲疾病预防控制中心(ECDC)等多个权威机构的数据,为全球公共卫生研究和政策制定提供了重要的数据支持。这一数据集的发布,极大地促进了全球对COVID-19疫情的监测和分析,成为相关研究的基础数据源。
当前挑战
COVID-19数据集在构建和维护过程中面临多重挑战。首先,数据来源广泛且多样化,包括各国政府和公共卫生机构,这要求数据集的维护者具备高度的数据整合和清洗能力。其次,由于疫情数据的实时性和动态性,数据集需要每日更新,这对数据处理和更新的自动化提出了高要求。此外,不同国家和地区的数据报告标准和频率存在差异,导致数据的一致性和准确性成为一大挑战。最后,全球范围内的数据隐私和安全问题也需要在数据收集和分发过程中得到妥善处理。
常用场景
经典使用场景
COVID-19数据集的经典使用场景主要集中在流行病学研究、公共卫生政策制定以及疫情趋势预测等领域。研究者通过分析每日更新的确诊病例、死亡病例和康复病例数据,可以深入探讨病毒传播模式、评估不同干预措施的效果,并为全球公共卫生决策提供科学依据。此外,该数据集还被广泛应用于开发和验证疫情预测模型,帮助各国政府和卫生机构制定有效的防控策略。
解决学术问题
COVID-19数据集解决了多个关键的学术研究问题,包括病毒传播动力学的量化、疫情爆发的早期预警系统构建以及公共卫生干预措施的评估。通过提供全球范围内的时间序列数据,该数据集使得研究者能够进行跨区域和跨时间的比较分析,从而揭示病毒传播的时空特征。此外,该数据集还为流行病学模型的验证和优化提供了宝贵的实证数据,推动了相关领域的理论和方法创新。
实际应用
在实际应用中,COVID-19数据集被广泛用于支持全球范围内的疫情监测和响应。各国卫生部门利用该数据集进行实时疫情分析,以便及时调整防控策略。医疗机构和研究机构则利用这些数据进行病例追踪和接触者管理,以减少病毒传播风险。此外,企业和教育机构也利用该数据集进行风险评估和业务连续性规划,确保在疫情波动中保持运营稳定。
数据集最近研究
最新研究方向
随着全球对COVID-19疫情的持续关注,COVID-19数据集的研究方向主要集中在疫情传播模型的优化、疫苗效果评估以及公共卫生政策的模拟。研究者们利用该数据集进行深度分析,以期更准确地预测疫情趋势,并为各国政府提供科学依据,以制定更为有效的防控策略。此外,数据集的跨学科应用也日益增多,如结合地理信息系统(GIS)和人工智能技术,以实现疫情数据的实时监控和动态调整。这些研究不仅有助于提升疫情应对的科学性,还对全球公共卫生体系的完善具有深远影响。
以上内容由遇见数据集搜集并总结生成



