COVID-19 US County-level Summaries
收藏县域社会经济数据集用于流行病效应预测建模
概述
该数据集旨在为数据科学、机器学习及流行病学建模社区提供与社会经济因素相关的机器可读数据,这些因素可能影响流行病爆发的传播和后果,特别是新型冠状病毒(COVID-19)。数据集包含超过300个变量,涵盖人口估计、人口统计、种族、住房、教育、就业和收入、气候、交通评分及医疗系统相关指标。
数据结构
- 数据文件夹:包含按县级别聚合的机器可读文件
counties.csv,数据按FIPS代码组织,确保每个县的唯一标识。 - 原始数据文件夹:包含用于创建数据文件夹的原始数据集。
- 模型文件夹:正在建设中。
- 脚本文件夹:包含将原始数据转换为机器可读格式的脚本。
数据添加指南
请在./raw_data目录下创建一个基于数据类型命名的新目录。
引用
如使用该数据集或代码,请引用相关论文: latex @article{killeenCountylevelDatasetInforming2020, title = {A {{County}}-Level {{Dataset}} for {{Informing}} the {{United States}} {{Response}} to {{COVID}}-19}, author = {Killeen, Benjamin D. and Wu, Jie Ying and Shah, Kinjal and Zapaishchykova, Anna and Nikutta, Philipp and Tamhane, Aniruddha and Chakraborty, Shreya and Wei, Jinchi and Gao, Tiger and Thies, Mareike and Unberath, Mathias}, year = {2020}, month = apr, archivePrefix = {arXiv}, eprint = {1909.11730}, eprinttype = {arxiv} }
致谢
该数据集是由约翰斯·霍普金斯大学的一组学生和教师共同努力的结果,特别感谢Jie Ying Wu、Benjamin Killeen等人的贡献。

- 1A County-level Dataset for Informing the United States' Response to COVID-19约翰斯·霍普金斯大学 · 2020年



