five

covid19-datasets|COVID-19研究数据集|公共卫生数据数据集

收藏
github2021-05-03 更新2024-05-31 收录
COVID-19研究
公共卫生数据
下载链接:
https://github.com/h2oai/covid19-datasets
下载链接
链接失效反馈
资源简介:
收集了用于COVID-19研究和分析的开放源数据集,包括全球和特定国家的病例、测试、医院资源等信息,以及计算机视觉和自然语言处理相关的数据集。

This dataset comprises open-source data collected for COVID-19 research and analysis, encompassing global and country-specific information on cases, testing, hospital resources, as well as datasets related to computer vision and natural language processing.
创建时间:
2020-03-26
原始信息汇总

数据集概述

全球级信息

  • JHU CSSE COVID-19 数据集:提供COVID-19病例数据。
  • COVID-19开放研究数据集:包含COVID-19相关研究论文。
  • 每日COVID-19病例数据集:提供每日病例数据。
  • COVID-19基因序列数据集:包含病毒基因序列信息。
  • 各国COVID-19检测数据:提供各国检测数量。
  • 政府因COVID-19采取的限制措施信息:记录各国政府响应措施。
  • 各国医生和护士人数数据集:提供每千人中的医生和护士人数。
  • 各国医院床位数数据集:提供各国医院床位数量。

国家级信息

美国

  • 美国COVID-19病例和测试数据:提供美国病例和测试数据。
  • 美国COVID-19病例数据集:提供美国病例数据。
  • 美国县级COVID-19病例数据:提供县级的病例数据。
  • 美国州级医院容量数据:提供州级医院容量信息。
  • 美国各县ICU床位数数据集:提供各县ICU床位数量。
  • 美国县级人口统计数据:提供县级的社会经济数据。
  • 美国州级政府干预数据:提供州级政府干预措施数据。

印度

  • 印度COVID-19病例数据集:提供印度病例数据。
  • 印度医院床位数据:提供印度医院床位数量。

其他国家

  • 韩国COVID-19病例数据集:提供韩国病例数据。
  • 意大利COVID-19病例数据:提供意大利病例数据。
  • 巴西COVID-19病例数据集:提供巴西病例数据。
  • 瑞士COVID-19病例数据集:提供瑞士病例数据。
  • 印尼COVID-19病例数据集:提供印尼病例数据。
  • 西班牙COVID-19病例数据集:提供西班牙病例数据。
  • 俄罗斯COVID-19病例数据集:提供俄罗斯病例数据。

计算机视觉

  • 意大利放射学病例COVID-19数据库:提供放射学病例数据。
  • COVID-19胸部X光和CT图像数据集:提供胸部影像数据。

自然语言处理

  • COVID-19开放专利数据集:提供COVID-19相关专利数据。
  • WHO COVID-19出版物数据库:提供全球研究出版物数据。
  • LitCOVID数据集:提供COVID-19相关文献数据。
  • COVID-19相关推文ID数据集:提供推文ID数据。
AI搜集汇总
数据集介绍
main_image_url
构建方式
covid19-datasets数据集的构建方式主要通过整合全球范围内多个公开数据源,涵盖了从全球到国家层面的多种疫情相关信息。这些数据源包括约翰霍普金斯大学系统科学与工程中心(JHU CSSE)的COVID-19病例数据、Kaggle平台上的多种疫情相关数据集,以及各国政府和研究机构发布的疫情数据。此外,数据集还包含了计算机视觉和自然语言处理领域的相关数据,如COVID-19的胸部X光和CT图像数据,以及与疫情相关的专利和文献数据。通过这些多源数据的整合,covid19-datasets为研究人员提供了全面且多维度的疫情分析资源。
特点
covid19-datasets数据集的特点在于其广泛的数据覆盖范围和多样的数据类型。该数据集不仅包含了全球范围内的疫情病例、检测、医疗资源等基础数据,还涵盖了各国政府应对疫情的干预措施、人口统计信息等高级数据。此外,数据集还整合了计算机视觉和自然语言处理领域的相关数据,如COVID-19的影像数据和疫情相关的文献、专利数据。这种多维度的数据结构使得该数据集能够支持从基础疫情分析到高级研究的多层次应用。
使用方法
covid19-datasets数据集的使用方法多样,适用于不同领域的研究人员。对于流行病学研究者,可以通过分析全球和国家的病例数据、检测数据以及医疗资源分布,进行疫情传播和防控策略的研究。对于计算机视觉领域的研究者,可以利用COVID-19的影像数据进行疾病诊断和分类模型的开发。自然语言处理领域的研究者则可以利用疫情相关的文献、专利和社交媒体数据,进行疫情信息传播和知识图谱的构建。此外,数据集的多源整合特性也使得跨学科研究成为可能,为疫情相关的多维度分析提供了丰富的数据支持。
背景与挑战
背景概述
covid19-datasets数据集是由全球多个研究机构和组织共同创建的开放源代码数据集集合,旨在支持COVID-19相关研究与分析。该数据集涵盖了从全球到国家层面的多种信息,包括病例数据、基因序列、医疗资源分布、政府干预措施等。主要研究人员和机构包括约翰霍普金斯大学系统科学与工程中心(JHU CSSE)、牛津大学、纽约时报等。其核心研究问题涉及病毒传播动态、医疗资源配置、政策干预效果等,对全球公共卫生研究和政策制定具有重要影响。
当前挑战
covid19-datasets在构建过程中面临多重挑战。首先,数据来源广泛且多样化,整合不同格式和标准的数据集需要高度的技术协调和标准化处理。其次,数据更新频率高,确保实时性和准确性是持续的挑战。此外,数据隐私和安全问题在处理个人健康信息时尤为重要。最后,如何从海量数据中提取有价值的信息,支持科学研究和政策决策,是该数据集面临的重要挑战。
常用场景
经典使用场景
covid19-datasets数据集在COVID-19研究领域中扮演着至关重要的角色,其经典使用场景涵盖了全球和各国的疫情数据分析。研究者可以利用该数据集进行疫情趋势预测、病例传播模式分析以及政府干预措施的效果评估。例如,通过整合JHU CSSE的全球病例数据和Oxford的政府响应追踪数据,研究者能够深入探讨不同政策对疫情控制的影响。
实际应用
在实际应用中,covid19-datasets数据集被广泛用于疫情监测、政策制定和公众健康教育。例如,各国政府和卫生机构利用该数据集进行疫情实时监控,及时调整防控策略。同时,医疗机构通过分析医院床位和ICU资源的使用情况,优化资源配置,提高应对突发公共卫生事件的能力。此外,媒体和教育机构也利用该数据集进行疫情相关信息的传播和科普,增强公众的健康意识。
衍生相关工作
covid19-datasets数据集的开放性和多样性催生了一系列相关研究工作。例如,基于该数据集的疫情预测模型研究已成为热点,研究者们开发了多种机器学习算法和深度学习模型,以提高预测精度。此外,该数据集还推动了自然语言处理和计算机视觉领域的应用,如通过分析COVID-19相关的专利和文献,提取关键信息,或通过分析胸部X光和CT图像,辅助诊断。这些衍生工作不仅丰富了COVID-19研究的工具箱,也为未来的公共卫生研究提供了宝贵的经验。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

AerialMegaDepth

AerialMegaDepth数据集是由卡内基梅隆大学研究者创建的,该数据集结合了伪合成渲染和真实地面图像,旨在推进从地面和空中视角的图像中学习几何重建和视图合成任务。数据集通过将3D城市级网格的伪合成渲染与来自MegaDepth的真实地面级图像在统一坐标系中注册,包含了137个地标和132,137个地理注册图像。该数据集在具有挑战性的地面-空中场景中,显著提高了基于学习的方法在多视图几何预测和新型视图合成任务上的性能。

arXiv 收录

CodeGen

CodeGen数据集是一个用于代码生成和理解的大型数据集,包含了多种编程语言的代码片段和相应的自然语言描述。该数据集旨在帮助研究人员和开发者训练和评估代码生成模型,提高代码生成的准确性和效率。

github.com 收录

ELSA

ELSA(English Longitudinal Study of Ageing)是一个纵向研究项目,旨在调查英国50岁及以上人群的健康、经济状况和社会关系。数据集包括参与者的健康状况、生活方式、经济状况、社会网络等多方面的信息。

www.elsa-project.ac.uk 收录

OMIM (Online Mendelian Inheritance in Man)

OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。

www.omim.org 收录