DELVE COVID-19 Dataset
收藏github2020-07-14 更新2024-05-31 收录
下载链接:
https://github.com/anurag0511/covid19_datasets
下载链接
链接失效反馈官方服务:
资源简介:
本仓库提供了一个综合多个来源的COVID-19研究数据集。数据集以CSV格式提供,可在大多数环境中加载。我们还提供了Python代码,用于访问某些情况下提供更多细节或更精细分辨率的基础数据集。
This repository provides a comprehensive COVID-19 research dataset compiled from multiple sources. The dataset is available in CSV format, which can be loaded in most environments. Additionally, we have included Python code to access the underlying datasets that offer more detailed or finer resolution in certain scenarios.
创建时间:
2020-07-03
原始信息汇总
DELVE COVID-19 Dataset 概述
数据集描述
- 名称: DELVE COVID-19 Dataset
- 目的: 为COVID-19研究提供综合数据集,整合自多个来源。
- 格式: CSV格式,适用于大多数分析环境。
- 附加资源: 提供Python代码访问更详细或高分辨率的底层数据集。
数据集使用
- 下载位置: GitHub仓库
- 加载方法:
- Python: 使用Pandas库直接读取CSV文件。
- R: 通过read.csv函数从URL读取。
示例与文档
- 示例: 提供两个Jupyter笔记本示例,包括基本探索性数据分析和底层数据集的使用。
- 代码本: Codebook 详细描述了数据集中的字段。
许可与引用
- 软件许可: MIT许可证
- 数据许可: 知识共享署名4.0国际许可
- 引用建议: 推荐使用BibTeX格式引用,强调包含访问日期的重要性。
数据来源
- 数据集整合了多个权威来源的数据,包括但不限于:
- 牛津政府响应追踪器
- ACAPS #COVID19政府措施
- 我们的数据世界
- 谷歌移动报告
- 世界银行数据银行
- 人类死亡率数据库
- 经济学人超额死亡追踪器
- 欧盟统计局
- 苹果地图移动趋势报告
- 英国气象局
- Simplemaps
- 国际标准化组织
搜集汇总
数据集介绍

构建方式
DELVE COVID-19数据集通过整合多个权威数据源构建而成,涵盖了全球范围内的COVID-19相关数据。数据源包括牛津政府响应追踪器、ACAPS政府措施数据集、Our World in Data等,确保了数据的全面性和时效性。数据集以CSV格式提供,便于用户在不同分析环境中加载和使用。此外,Python和R的代码示例进一步简化了数据的访问过程。
特点
该数据集的特点在于其多维度的数据覆盖,不仅包括疫情传播数据,还整合了政府响应措施、人口流动趋势、社会经济指标等多方面信息。数据集的高分辨率和详细字段设计使其能够支持复杂的疫情分析和政策评估。数据源的多样性和更新频率保证了数据的实时性和可靠性,为研究者提供了丰富的分析视角。
使用方法
用户可以通过下载CSV文件直接加载到常用的数据分析工具中,如Pandas或R。Python用户可以使用提供的代码示例快速导入数据,并利用Jupyter Notebook进行探索性数据分析。数据集的使用方法灵活多样,支持从基础统计分析到复杂模型构建的多种应用场景。此外,数据集附带的代码书详细描述了字段信息,帮助用户更好地理解和使用数据。
背景与挑战
背景概述
DELVE COVID-19数据集由英国皇家学会(Royal Society)的DELVE计划于2020年创建,旨在为全球COVID-19研究提供全面且多源的数据支持。该数据集整合了来自牛津大学政府响应追踪器、ACAPS政府措施数据集、Our World in Data等多个权威数据源的信息,涵盖了疫情相关的政府政策、人口流动、死亡率等多维度数据。其核心研究问题聚焦于通过多源数据的融合与分析,揭示COVID-19疫情对全球社会经济、公共卫生政策及人口流动的深远影响。该数据集为学术界和政策制定者提供了重要的数据基础,推动了疫情相关研究的深入发展。
当前挑战
DELVE COVID-19数据集在解决COVID-19疫情相关研究问题时面临多重挑战。首先,数据源的多样性和异构性导致数据整合与清洗的复杂性显著增加,需确保不同数据源之间的时间、空间和指标一致性。其次,疫情数据的动态性和实时更新需求对数据集的维护提出了高要求,需频繁更新以反映最新的疫情发展。此外,数据隐私与伦理问题亦不容忽视,尤其是在处理涉及个人健康信息的数据时,需严格遵守相关法律法规。构建过程中,研究人员还需应对数据缺失、不一致性及跨区域数据标准差异等技术难题,以确保数据集的科学性和实用性。
常用场景
经典使用场景
DELVE COVID-19数据集广泛应用于全球范围内的COVID-19疫情研究,特别是在分析政府应对措施、疫情传播趋势以及社会经济影响方面。研究人员通过该数据集进行时间序列分析、地理空间分析以及多变量回归分析,以揭示疫情发展的动态变化及其背后的驱动因素。
解决学术问题
该数据集整合了来自多个权威来源的COVID-19相关数据,解决了学术界在疫情研究中数据分散、不一致的问题。通过提供统一的数据格式和详细的字段描述,研究人员能够更高效地进行跨国比较、政策效果评估以及疫情预测模型的构建,从而推动了对COVID-19的深入理解。
衍生相关工作
基于DELVE COVID-19数据集,许多经典研究工作得以展开,例如《The Lancet》和《Nature》等顶级期刊上发表的关于疫情传播模型和政策效果评估的研究。此外,该数据集还催生了一系列开源工具和可视化平台,如疫情地图和动态仪表盘,进一步推动了COVID-19研究的透明化和公众参与。
以上内容由遇见数据集搜集并总结生成



