five

Italian Coronavirus Cases by Age group and Sex (ICCAS)

收藏
github2023-06-15 更新2024-05-31 收录
下载链接:
https://github.com/janLuke/iccas-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含意大利Sars-CoV-2确诊病例和死亡病例,按年龄组和性别细分。数据自动提取自意大利国家卫生研究所(ISS)发布的PDF报告。

This dataset comprises confirmed cases and fatalities of Sars-CoV-2 in Italy, categorized by age groups and gender. The data is automatically extracted from PDF reports published by the Italian National Health Institute (ISS).
创建时间:
2020-04-03
原始信息汇总

数据集概述

数据集名称

Italian Coronavirus Cases by Age group and Sex (ICCAS)

数据来源

数据自动提取自意大利国家卫生研究所(Istituto Superiore di Sanità, ISS)发布的PDF报告。

数据内容

数据集包含意大利Sars-CoV-2确诊病例和死亡病例,按年龄组和性别细分。

更新频率

报告最初每周发布两次,自四月起改为每周一次。

数据集结构

数据集位于data文件夹,结构如下:

data ├── by-date
│ └── iccas_{date}.csv Dataset with cases/deaths updated to a specific {date} ├── util
│ ├── italian_population_by_age_2020.csv [1] │ └── italian_population_by_age_group_2020.csv [1] └── iccas_full.csv Concatenation of all datasets iccas_{date}.csv

数据集字段描述

字段 描述
date 意大利当地时间,ISO-8601格式 yyyy-mm-ddThh:mm
age_group 年龄组,值包括:"0-9", "10-19", ..., "80-89", ">=90", "unknown"
cases 自疫情开始以来的确诊病例数(包括性别未知的病例)
deaths 自疫情开始以来的死亡病例数(包括性别未知的病例)
{sex}_cases 自疫情开始以来的特定性别确诊病例数
{sex}_deaths 自疫情开始以来的特定性别死亡病例数
cases_percentage 年龄组内病例数占总病例数的百分比
deaths_percentage 年龄组内死亡数占总死亡数的百分比
fatality_rate 死亡率,即死亡病例数与确诊病例数的比率
{sex}_cases_percentage 特定性别病例数占男女病例总数的百分比
{sex}_deaths_percentage 特定性别死亡数占男女死亡总数的百分比
{sex}_fatality_rate 特定性别死亡率,即特定性别死亡病例数与确诊病例数的比率

注意事项

  • cases 包括性别未知的病例,因此 male_casesfemale_cases 的总和不等于 cases
  • deaths 包括性别未知的死亡,因此 male_deathsfemale_deaths 的总和不等于 deaths
  • 计算 cases_percentagedeaths_percentage 时,应考虑年龄未知的情况。
搜集汇总
数据集介绍
main_image_url
构建方式
意大利冠状病毒病例按年龄和性别分类数据集(ICCAS)的构建基于意大利国家卫生研究所(ISS)发布的PDF报告。这些报告最初每周发布两次,自四月起改为每周一次。数据集通过自动化流程从这些报告中提取数据,并定期更新。数据提取过程涉及将PDF文件中的信息转换为结构化的CSV格式,确保数据的准确性和一致性。
特点
ICCAS数据集提供了意大利COVID-19确诊病例和死亡病例的详细分类,按年龄组和性别进行划分。数据集包含多个关键指标,如病例数、死亡数、性别特定病例数及死亡率等。此外,数据集还提供了百分比和死亡率等衍生指标,便于进行深入分析。数据集的独特之处在于其详细的分层数据,使得研究人员能够从多个维度分析疫情的影响。
使用方法
ICCAS数据集的使用方法包括通过Python包进行数据下载、处理和可视化。用户可以通过Jupyter笔记本运行预定义的表格和图表,这些笔记本可在Binder平台上直接运行。数据集的结构化格式使其易于与其他数据源集成,支持进一步的分析和建模。用户还可以利用数据集中的百分比和死亡率等指标,进行疫情趋势分析和预测。
背景与挑战
背景概述
意大利冠状病毒按年龄和性别分组病例数据集(ICCAS)由意大利国家卫生研究所(Istituto Superiore di Sanità, ISS)发布,旨在提供意大利COVID-19疫情的详细统计数据。该数据集自2020年初开始收集,涵盖了按年龄组和性别分类的确诊病例和死亡病例数据。数据来源为ISS定期发布的PDF报告,最初每周发布两次,后改为每周一次。该数据集通过自动化工作流进行更新,确保了数据的时效性和准确性。ICCAS数据集为研究人员和政策制定者提供了重要的参考,帮助他们更好地理解疫情在不同人口群体中的传播和影响。
当前挑战
ICCAS数据集在构建和应用过程中面临多重挑战。首先,数据提取自PDF格式的报告,自动化处理过程中需克服格式不一致和文本解析的复杂性。其次,数据中包含未知性别和未知年龄的病例,这增加了数据清洗和分析的难度。此外,由于ISS报告的发布频率和格式变化,数据集更新机制需不断调整以保持数据的连续性和一致性。最后,数据集的广泛应用要求其具备高度的透明性和可重复性,这对数据处理流程和文档化提出了更高的要求。
常用场景
经典使用场景
Italian Coronavirus Cases by Age group and Sex (ICCAS) 数据集主要用于分析意大利COVID-19疫情的年龄和性别分布。该数据集通过定期更新的PDF报告,提供了按年龄组和性别分类的确诊病例和死亡数据。研究人员可以利用这些数据进行流行病学分析,探讨不同年龄段和性别群体在疫情中的感染率和死亡率差异。
衍生相关工作
ICCAS数据集衍生了许多相关研究工作,特别是在COVID-19疫情的流行病学建模和预测领域。基于该数据集的研究成果包括对不同年龄段和性别群体的感染率和死亡率进行统计分析,以及开发基于机器学习的疫情预测模型。此外,该数据集还被用于评估公共卫生干预措施的效果,如封锁政策和疫苗接种策略的有效性。这些研究为全球范围内的疫情防控提供了宝贵的经验和参考。
数据集最近研究
最新研究方向
近年来,随着COVID-19疫情的持续蔓延,意大利冠状病毒病例按年龄和性别分类的数据集(ICCAS)在流行病学研究中扮演了重要角色。该数据集通过自动提取意大利国家卫生研究所(ISS)发布的PDF报告,提供了详细的病例和死亡数据,按年龄组和性别进行分类。这一数据集的独特之处在于其能够揭示不同年龄段和性别群体在疫情中的感染和死亡模式,为公共卫生政策的制定提供了科学依据。当前的研究方向主要集中在利用这些数据进行疫情趋势预测、疫苗分配策略优化以及高风险群体的识别。此外,随着ISS开始发布每日更新的xlsx格式数据,ICCAS数据集的研究价值进一步提升,尤其是在实时监测和快速响应方面。这一数据集的应用不仅限于意大利本土,还为全球其他地区的疫情研究提供了宝贵的参考。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务