COVID-Pro Dataset
收藏github2021-08-05 更新2024-05-31 收录
下载链接:
https://github.com/CEEDS-DEMM/COVID-Pro-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了意大利77个省份的Covid-19死亡数据,数据通过抓取13个地区的每日新闻发布会和Covid-19公告获得。
This dataset comprises COVID-19 mortality data from 77 provinces in Italy, obtained by scraping daily press conferences and COVID-19 bulletins from 13 regions.
创建时间:
2020-06-02
原始信息汇总
COVID-Pro Dataset 概述
数据集描述
- 名称: COVID-Pro Dataset
- 目的: 用于开发名为 "COVID-Pro: a province-based analysis for Italy" 的Dashboard,该Dashboard由UNIMI的DEMM部门开发。
数据收集方法
- 数据来源: 通过爬取意大利13个地区的每日新闻发布会和Covid-19公告,收集了大部分意大利省份的每日因Covid-19死亡的数据。
- 特殊情况: Aosta省、Bolzano/Bozen省和Trento省的数据包含在意大利卫生部的区域数据中。
数据集内容
- 包含省份: 数据集包含了意大利多个省份的Covid-19死亡数据,具体省份包括Agrigento, Alessandria, Ancona等。
- 数据源列表: 为每个意大利地区提供了主要的爬取数据源,例如Abruzzo地区的数据源为https://www.regione.abruzzo.it/notizie_stampa。
贡献者
- 开发团队: L. Ferrari, G. Gerardi, G. Manzi, A. Micheletti, F. Nicolussi, S. Salini
- 实习生贡献者: R. Baby, A. Iordache, A. Singh, N. Verardo
数据可用性
- 部分区域数据缺失: 如Campania, Friuli-Venezia-Giulia, Veneto等地区没有可用的数据。
搜集汇总
数据集介绍

构建方式
COVID-Pro数据集的构建基于意大利13个地区的每日新闻发布会和COVID-19公告数据。由于意大利卫生部和民防机构的官方数据未提供省级每日死亡数据,研究团队通过网页抓取技术,从这些地区的官方渠道获取了详细的省级死亡数据。特别是Aosta省以及Bolzano/Bozen和Trento省,由于其与地区重合或作为自治省的特殊地位,数据被直接纳入地区数据中。
特点
COVID-Pro数据集涵盖了意大利大多数省份的COVID-19每日死亡数据,具有高度的地域细粒度。数据集不仅提供了详细的省级数据,还通过整合多个地区的数据源,确保了数据的全面性和时效性。此外,数据集特别关注了意大利北部疫情严重的地区,为研究者提供了丰富的地理和流行病学分析基础。
使用方法
COVID-Pro数据集适用于流行病学、公共卫生政策分析以及地理信息系统研究。研究者可以通过该数据集进行省级层面的疫情趋势分析、死亡率的空间分布研究以及政策干预效果的评估。数据集的结构化格式便于直接导入数据分析工具,如R或Python,进行进一步的数据处理和可视化分析。
背景与挑战
背景概述
COVID-Pro数据集由意大利米兰大学经济、管理与定量方法系(DEMM)的研究团队开发,旨在提供意大利省级层面的COVID-19死亡数据。该数据集创建于2020年,主要研究人员包括L. Ferrari、G. Gerardi、G. Manzi等。由于意大利卫生部与民防局的官方数据未提供省级每日死亡数据,研究团队通过爬取13个地区的每日新闻发布会和疫情公告,成功构建了这一数据集。该数据集为意大利各省的疫情分析提供了重要支持,尤其在省级层面的疫情监测与政策制定中发挥了关键作用。
当前挑战
COVID-Pro数据集在构建过程中面临多重挑战。首先,意大利卫生部未提供省级每日死亡数据,研究团队需通过爬取各地区发布的非结构化数据来填补这一空白,数据来源的多样性与不一致性增加了数据整合的难度。其次,部分地区的疫情数据缺失或不完整,导致数据集覆盖范围受限。此外,数据爬取与清洗过程中,需处理大量非标准化文本信息,确保数据的准确性与一致性。这些挑战不仅影响了数据集的完整性,也对后续的疫情分析与建模提出了更高的要求。
常用场景
经典使用场景
COVID-Pro数据集主要用于分析和研究COVID-19疫情在意大利各省的传播和影响。该数据集通过收集和整理意大利各地区发布的每日疫情数据,特别是死亡病例的省级分布,为研究人员提供了一个详尽的省级疫情动态视图。这使得研究者能够深入探讨疫情在不同地理区域的传播模式、影响因素及其对公共卫生系统的压力。
实际应用
在实际应用中,COVID-Pro数据集被广泛用于开发疫情监控仪表板,如“COVID-Pro: a province-based analysis for Italy”。这些仪表板帮助政府机构和公共卫生专家实时监控疫情发展,评估防控措施的效果,并预测疫情趋势。此外,数据集还被用于教育和培训,帮助学生和研究人员理解数据科学在公共卫生领域的应用。
衍生相关工作
基于COVID-Pro数据集,多项研究和工作得以展开,包括疫情传播模型的构建、风险评估工具的开发以及公共卫生政策的评估。这些工作不仅深化了对COVID-19疫情的理解,也为未来可能出现的公共卫生危机提供了数据支持和分析框架。此外,该数据集还促进了跨学科合作,结合了经济学、管理学和定量方法,为疫情研究提供了多维度的视角。
以上内容由遇见数据集搜集并总结生成



