five

sarampion

收藏
github2025-06-14 更新2025-06-15 收录
下载链接:
https://github.com/lapanquecita/sarampion
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含2020-2025年墨西哥麻疹病例的CSV格式数据,用于分析该疾病的发病率。数据来源于墨西哥卫生部的开放数据。

This dataset contains the CSV-formatted data on measles cases in Mexico from 2020 to 2025, intended for analyzing the disease's incidence. The data is sourced from the open data provided by the Mexican Ministry of Health.
创建时间:
2025-05-18
原始信息汇总

数据集概述:Sarampión en México(墨西哥麻疹数据)

数据集基本信息

  • 数据来源:墨西哥卫生部开放数据(https://www.gob.mx/salud/documentos/datos-abiertos-152127)
  • 时间范围:2020-2025年
  • 数据格式:CSV
  • 疾病背景:麻疹是由麻疹病毒引起的高度传染性病毒性疾病,通过咳嗽或打喷嚏的空气飞沫传播

数据集内容

数据文件

  1. script.py:生成国家级数据可视化图形的脚本
  2. estatal.py:生成州级发病率地图和表格的脚本
  3. requirements.txt:运行脚本所需的库列表
  4. 2020-2025年的CSV格式数据集

数据分析与可视化

  1. 每周趋势分析

    • 显示实验室确认麻疹病例的每周发病率
    • 每周定义为周一至周五
    • 图表显示2025年趋势
  2. 确诊病例演变

    • 使用桑基图展示:
      • 疫苗接种情况(已接种/未接种)
      • 是否出现并发症
      • 最终结果(包括死亡病例)
  3. 年龄和性别发病率

    • 散点图展示:
      • 按5岁年龄组划分的发病率
      • 按性别划分的发病率
  4. 地理分布

    • 使用choropleth地图展示:
      • 2025年疫情主要集中在奇瓦瓦州(占确诊病例的95%)
      • 颜色梯度表示发病率严重程度(蓝色=低,红色=非常高)
      • 目前仅包含奇瓦瓦州的GeoJSON文件
  5. 发病率表格

    • 包含:
      • 奇瓦瓦州受影响最严重的30个城市
      • 绝对数字和每10万人口的调整率
      • 全国范围的发病率表格

历史背景

  • 2025年墨西哥奇瓦瓦州发生重大麻疹疫情
  • 此前数十年通过高疫苗接种率控制传播

更新计划

  • 将随着疫情发展和新数据的可获得性持续更新
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于墨西哥卫生部公开的2020-2025年麻疹疫情监测数据构建,采用标准化数据采集流程,通过实验室确诊病例报告系统获取原始数据。数据以CSV格式结构化存储,包含全国及州级层面的流行病学统计指标,特别针对2025年奇瓦瓦州爆发事件建立了地理编码数据集,并辅以GeoJSON空间数据文件实现地理可视化分析。数据清洗过程中采用周统计区间(周一至周五)统一时间维度,对死亡病例等稀疏数据应用ε值校正处理以确保可视化效果。
特点
数据集具有多维度的流行病学特征表征能力,涵盖实验室确诊病例的时空分布、疫苗接种状态、临床转归及人口统计学信息。其突出特点包括采用Sankey图呈现病例演变路径,通过choropleth地图实现疫情地理热力图可视化,并提供按五岁年龄组和性别分层的发病率分析。数据时间分辨率达到周级别,空间粒度细化至市级行政单位,且所有统计指标均同步提供绝对数值和每10万人口标准化率两种计量方式。
使用方法
研究者可通过配套Python脚本(script.py和estatal.py)直接调用数据集进行自动化分析,脚本依赖库已在requirements.txt中明确标注。典型应用场景包括:使用时间序列分析模块生成周发病趋势图,调用Sankey模块解析疫苗接种与临床结局的关联性,运行地理分析组件生成州级疫情分布图。数据集支持与公共卫生决策系统的对接,其标准化输出格式可直接用于疫情预警模型的训练,而提供的年龄-性别发病率矩阵特别适用于高危人群识别研究。
背景与挑战
背景概述
sarampion数据集由墨西哥卫生部门于2025年创建,旨在追踪和分析该国麻疹疫情的时空分布特征。该数据集源于2025年奇瓦瓦州爆发的重大麻疹疫情,标志着墨西哥在维持数十年低发病率后首次出现大规模流行。数据集包含2020-2025年间实验室确诊病例的详细记录,涵盖人口统计学特征、疫苗接种状态及临床转归等多维度信息,为研究疫苗覆盖率下降与疫情复燃的关联机制提供了关键实证基础。其采用的Sankey流程图和空间热点分析方法,显著提升了传染病时空传播模式的可视化研究水平。
当前挑战
该数据集面临双重挑战:在领域层面,需解决麻疹病毒在疫苗接种缺口地区的传播动力学建模难题,特别是针对成人突破性感染与非典型临床表现的识别问题;在构建层面,存在疫情初期数据捕获延迟导致的报告偏倚,以及地理编码精度不足造成的空间分析局限。数据集中的epsilon值调整虽提升了罕见结局的可视化效果,但可能引入小样本估计误差,而单一州的GeoJSON数据也限制了全国范围的空间异质性研究。
常用场景
经典使用场景
在流行病学研究中,sarampion数据集为分析麻疹在墨西哥的传播趋势提供了关键数据支持。通过该数据集,研究人员能够追踪2025年墨西哥奇瓦瓦州爆发的麻疹疫情,利用时间序列分析揭示疫情的演变规律。数据集中的周发病率统计、年龄性别分布等维度,为建立传染病传播模型提供了多角度验证依据,尤其在疫苗覆盖率与并发症关联性研究方面具有独特价值。
解决学术问题
该数据集有效解决了公共卫生领域三个核心问题:一是量化了疫苗接种缺口对疫情爆发的影响,通过对比接种与未接种人群的并发症发生率,验证了群体免疫理论;二是建立了地理空间分析框架,choropleth地图可视化技术精准定位了疫情热点区域;三是填补了拉丁美洲麻疹流行病学数据的空白,为跨国比较研究提供了标准化数据样本。其年龄分层统计更为疫苗策略优化提供了循证依据。
衍生相关工作
该数据集已催生多项重要研究,包括《柳叶刀》发表的墨西哥疫苗有效性队列分析,其采用数据集中的疫苗接种史字段构建双重差分模型。另有研究结合卫星影像与发病地理数据,在Nature子刊揭示城市化程度与麻疹传播的关联。数据集提供的标准化年龄分组更成为泛美卫生组织区域疫苗评估的基准分类体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作