COVID19-datasets
收藏github2020-04-21 更新2024-05-31 收录
下载链接:
https://github.com/lkorczowski/COVID19-datasets
下载链接
链接失效反馈官方服务:
资源简介:
包含多个公开的COVID-19数据集、可视化工具和机器学习资源,数据集按地理区域划分,并提供了详细的数据集列表和描述。
本数据集汇集了多个公开的COVID-19数据集、可视化工具及机器学习资源,其中数据集按照地理区域进行分类,并附有详尽的数据集清单及其描述。
创建时间:
2020-03-17
原始信息汇总
COVID19数据集概述
数据集列表
-
全球数据集
- CSSEGISandData/COVID-19: 由约翰霍普金斯大学系统科学与工程中心运营的可视化仪表板,汇总了多个原始数据源,提供全国每日报告和时间序列数据(.csv)。
- datasets/covid-19: 对CSSEGISandData/COVID-19数据集进行规范化处理,转换日期格式以提高机器可读性(.csv)。
- pomber/covid19: CSSEGISandData/COVID-19数据集的JSON格式,被多个其他项目使用。
- COVID-19 Open Research Dataset Challenge (CORD-19): Kaggle发起的数据挑战,旨在寻找基于数据的对疾病的答案,也提供在semanticscholar上(
individual)。 - Novel Corona Virus 2019 Dataset: 提供个体级数据(.csv)。
- Corona Data Scraper: 从验证来源拉取COVID-19冠状病毒病例数据(.json, .csv)。
- Geographic distribution of COVID-19 cases worldwide: 提供全球COVID-19病例的地理分布数据(.xlsx)。
- Dimensions COVID-19: 列出多个用于学术文献的数据集。
-
亚洲数据集
- SOUTH KOREA jihoo-kim/Coronavirus-Dataset: 提供个体级数据,也在Kaggle上提供。
-
欧洲数据集
- FRANCE opencovid19-fr/data: 汇总法国区域数据。
- FRANCE lperez31/coronavirus-france-dataset: 汇总法国个体级数据,也在Kaggle上提供。
- FRANCE Confirmed cases per region: 提供法国官方政府确认的个体级数据(.csv, .svg)。
- FRANCE Interventions on suspicious case of COVID-19: 提供三个数据集:医疗行为、住院率和紧急率(.csv, .ods, .xlsx)。
- ITALY covid19-in-italy: 提供意大利个体级数据,也在GitHub上提供。
- SPAIN Situación epidemiológica del coronavirus (COVID-19) en Castilla y León
原始数据源
-
全球原始数据源
- 世界卫生组织(WHO)
- DXY.cn
- BNO News
-
亚洲原始数据源
- 中国国家卫生健康委员会
- 中国CDC
- 香港卫生署
- 澳门政府
- 台湾CDC
- 新加坡卫生部
-
北美原始数据源
- 美国CDC
- 加拿大政府
-
大洋洲原始数据源
- 澳大利亚卫生部
-
欧洲原始数据源
- 欧洲疾病预防控制中心(ECDC)
- 意大利卫生部
COVID19分析相关资源
-
R语言资源
- EpiEstim: 估计时间变化的复制数
- COVID-19 epidemiology with R: 可视化CSSEGISandData数据集+抓取维基百科数据
- HospiCov: 估计治疗SARS-CoV-2感染患者所需的医院资源
- EpiNow: 实时估计病例数和时间变化的流行病学参数
- EpiSoon: 短期预测有效复制数
- covid19_bed_occupancy: 提供未来床位占用估计的Shiny应用
- covid19-short-term-forecasts: 预测具有持续本地传播的国家的每日COVID-19死亡人数
-
Python资源
- covid19model: 估计COVID19的死亡和病例数
- COVID-19: 结合两种感染建模策略
- EndemicPy: 模拟广泛的传输过程
- scispaCy: 处理生物医学、科学或临床文本的spaCy模型
- scibert: 科学文本的预训练语言模型
- covid19-incrementality: 量化法国因COVID-19导致的全球死亡增加
- covid19-severity-prediction: COVID19数据+县和医院级别的建模
- COVID19: 使用卡尔曼滤波器预测冠状病毒传播
- COVID-19-CaseStudy-and-Predictions: COVID-19大流行传播的案例研究、分析和可视化
- coronavirus_visualization_and_prediction: 跟踪SARS-CoV-2的传播
- covid19-agestructureSEIR-wuhan-social-distancing: 武汉COVID-19暴发的年龄结构SEIR模型
-
JavaScript资源
- coronavirus-api: 专门提供冠状病毒数据的API
- disease: 在p5.js中模拟疾病传播
- Epidemic Calculator: 建模COVID19可能路径的可视化计算器
- covid19: 跟踪COVID-19冠状病毒爆发的交互式、动画地图
搜集汇总
数据集介绍

构建方式
COVID19-datasets数据集通过广泛收集并整合全球公开的COVID-19相关数据资源构建而成,包含不同地理区域的聚合数据及个体数据。构建过程中,数据集编制者遵循地域分类原则,并鼓励社区参与,通过GitHub的分支、提交和拉取请求对数据集进行更新与维护。
使用方法
用户可以通过GitHub页面获取数据集,并根据需要选择不同格式的数据文件,如CSV、JSON、Excel等。此外,数据集提供了多种编程语言环境的分析工具和API接口,方便研究人员进行疫情数据分析、建模与预测。
背景与挑战
背景概述
COVID19-datasets数据集是一组关于新型冠状病毒肺炎(COVID-19)的公开数据集资源列表,由病毒株SARS-CoV-2(也称2019-nCoV)引起。该数据集由Johns Hopkins University Center for Systems Science and Engineering等机构创建于2020年,旨在为研究人员提供全球范围内的疫情数据,包括时间序列、可视化工具、相关文献等资源,对全球疫情分析研究产生了重大影响。
当前挑战
该数据集在构建过程中所遇到的挑战主要包括:1)数据来源的多样性和异质性,导致数据清洗和标准化难度大;2)实时更新数据的准确性和可靠性验证困难;3)数据隐私和伦理问题,尤其是在处理个人级别的数据时。在研究领域问题上,COVID19数据集面临的挑战包括:如何通过数据分析有效预测疫情发展趋势,评估公共卫生干预措施的影响,以及为医疗资源分配提供科学依据。
常用场景
经典使用场景
COVID19-datasets作为全球疫情数据的集合,其经典使用场景在于为研究人员提供详尽的疫情数据,支持疫情发展态势的可视化展示、传播模型的构建以及疫情预测等研究工作。通过该数据集,研究者可以分析疫情在不同地区、不同时间点的发展情况,为政策制定者提供决策支持。
解决学术问题
该数据集解决了学术研究中对于疫情数据的不完整性和不一致性问题,提供了全球范围内的疫情数据,支持跨地区、跨国家的疫情比较研究,助力于流行病学模型的确立与验证,为疫情防控策略的制定提供了数据支撑。
实际应用
在实际应用中,COVID19-datasets为公共卫生部门、医疗系统以及政策制定者提供了疫情监控和风险评估的重要工具。通过对该数据集的分析,可以实时掌握疫情动态,预测疫情发展趋势,从而优化资源配置,提高应急响应能力。
数据集最近研究
最新研究方向
COVID19-datasets 数据集在本领域的前沿研究方向主要包括疫情的实时监控、预测模型构建、疫情传播的时空分析以及疫情对医疗资源需求的影响评估。研究人员运用机器学习算法对疫情数据进行实时分析,预测疫情发展趋势,评估非药物干预措施的效果,并探索疫情与社会经济因素的关联。该数据集的影响和意义在于为全球研究者提供了宝贵的一手资料,推动了疫情防控策略的优化和公共卫生决策的科学化。
以上内容由遇见数据集搜集并总结生成



