five

COVID-19 Dataset|新冠病毒统计数据集|实时数据更新数据集

收藏
github2022-01-11 更新2024-05-31 收录
新冠病毒统计
实时数据更新
下载链接:
https://github.com/TuTomasz/Covid19-Dataset
下载链接
链接失效反馈
资源简介:
该数据集包含全球新冠病毒统计数据,以JSON格式提供,数据来源为约翰斯·霍普金斯大学系统科学与工程中心。数据集自动更新,确保与原始数据源同步,并提供额外的统计信息。

This dataset encompasses global COVID-19 statistics, provided in JSON format, sourced from the Center for Systems Science and Engineering at Johns Hopkins University. The dataset is automatically updated to ensure synchronization with the original data source and includes additional statistical information.
创建时间:
2020-03-28
原始信息汇总

COVID-19 Dataset 概述

数据集描述

本项目将Johns Hopkins CSSE的2019 Novel Coronavirus COVID-19 (2019-nCoV)数据仓库中的CSV格式数据转换为JSON格式,并计划添加更多字段和统计数据。数据会自动定时更新,确保与原始数据源同步。

数据格式

全球每日数据

  • 日期:关注的日期
  • 全球感染总数:全球感染人数
  • 全球康复总数:全球康复人数
  • 全球死亡总数:全球死亡人数
  • 新增病例:自前一天以来的新增病例数
  • 新增死亡:自前一天以来的新增死亡数
  • 每小时死亡数:每小时死亡人数
  • 感染百分比:基于全球人口的感染百分比
  • 康复百分比:基于全球人口的康复百分比
  • 死亡百分比:基于全球人口的死亡百分比
  • 翻倍率:病毒翻倍的天数(5天滚动周期)
  • 死亡率:关注的国家的当前死亡率

美国每日数据

  • 日期:关注的日期
  • 州感染总数:特定州的感染人数
  • 州死亡总数:特定州的死亡人数
  • 州总人口:州的全部人口
  • 新增病例:特定州自前一天以来的新增病例数
  • 新增死亡:特定州自前一天以来的新增死亡数
  • 每小时死亡数:每小时死亡人数
  • 感染百分比:基于州人口的感染百分比
  • 死亡百分比:基于州人口的死亡百分比
  • 翻倍率:病毒翻倍的天数(5天滚动周期)
  • 死亡率:关注的州的当前死亡率

数据集链接

AI搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19数据集通过自动化流程从约翰霍普金斯大学系统科学与工程中心(JHU CSSE)的2019新型冠状病毒(COVID-19)数据仓库中提取CSV格式数据,并将其转换为JSON格式。该数据集包含全球和美国的每日疫情数据,如感染总数、康复总数、死亡总数等关键指标。数据通过定期自动更新,确保与原始数据源保持同步,从而提供最新的疫情动态。
特点
该数据集的特点在于其全面性和实时性。它不仅提供了全球范围内的疫情统计数据,还详细记录了美国各州的疫情发展情况。数据集中的每个条目都包含了丰富的统计指标,如新增病例数、新增死亡数、每小时死亡数、感染率、死亡率等,这些数据为研究人员和政策制定者提供了宝贵的参考信息。此外,数据的JSON格式设计使得其易于解析和集成到各种分析工具中。
使用方法
使用COVID-19数据集时,用户可以通过提供的URL直接访问全球或美国的疫情数据。数据集支持多种编程语言进行数据获取,如JavaScript和Python。用户可以通过简单的API调用,获取特定日期或地区的疫情数据,并进行进一步的分析或可视化。例如,使用JavaScript的fetch函数可以轻松获取全球数据,而Python的urllib3库则可用于获取并解析JSON格式的数据。这些方法使得数据集的使用既灵活又高效。
背景与挑战
背景概述
COVID-19数据集由约翰斯·霍普金斯大学系统科学与工程中心(JHU CSSE)于2020年初创建,旨在为全球研究人员提供关于新型冠状病毒(COVID-19)疫情的实时数据。该数据集通过自动更新机制,确保数据的时效性,涵盖了全球及美国各州的感染、康复和死亡病例的详细统计信息。其核心研究问题在于通过数据驱动的分析,帮助理解疫情的传播动态、评估防控措施的效果,并为公共卫生决策提供科学依据。该数据集在疫情期间被广泛应用于流行病学建模、政策制定和公众信息传播,对全球抗疫工作产生了深远影响。
当前挑战
COVID-19数据集在解决疫情数据可视化和分析方面面临多重挑战。首先,数据的实时性和准确性至关重要,但由于不同国家和地区的报告标准不一致,数据整合和清洗成为一大难题。其次,疫情数据的动态变化要求数据集具备高效的更新机制,以确保信息的及时性。此外,数据格式的转换(如从CSV到JSON)和统计指标的扩展(如感染率、死亡率等)增加了数据处理的复杂性。在构建过程中,研究人员还需应对数据源的多样性和异构性,确保数据的完整性和一致性,这对数据工程和算法设计提出了更高的要求。
常用场景
经典使用场景
COVID-19数据集在全球范围内被广泛用于追踪和分析新冠病毒的传播动态。研究人员利用该数据集中的每日感染、康复和死亡数据,构建时间序列模型,预测疫情发展趋势。此外,该数据集还被用于分析不同国家和地区的疫情响应措施对病毒传播的影响,为公共卫生政策的制定提供数据支持。
实际应用
在实际应用中,COVID-19数据集被广泛应用于政府和公共卫生机构的决策支持系统中。例如,美国各州政府利用该数据集中的州级数据,实时监控疫情发展,调整防控策略。此外,医疗机构也利用这些数据优化资源配置,确保医疗资源的合理分配,以应对疫情高峰期的需求。
衍生相关工作
基于COVID-19数据集,许多经典研究工作得以展开。例如,研究人员开发了多种疫情预测模型,如基于机器学习的传播预测算法和基于统计学的死亡率分析模型。此外,该数据集还催生了许多可视化工具和平台,帮助公众更直观地理解疫情发展态势,增强了信息的透明度和传播效率。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

rag-datasets/rag-mini-bioasq

该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。

hugging_face 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录