five

electricsheepafrica/africa-who-number-of-pigs-in-the-country

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-pigs-in-the-country
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家2016-2020年间猪的数量的WHO GHO指标(NTD_TSOL3)的国家级观测数据。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并重新打包为具有一致模式的Parquet文件。所有值均来自NumericValue(浮点精度字段),而不是显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Number of pigs in the country (`NTD_TSOL3`) across African nations, spanning 2016–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家内猪的存栏数量这一特定指标。数据经过系统化抽取与清洗,以Parquet文件格式进行封装,并采用一致的字段架构进行组织。所有数值均取自高精度的浮点型字段NumericValue,同时保留置信区间上下界信息以增强数据的统计严谨性。最终形成一个包含44个非洲国家、覆盖2016至2020年时间跨度的87条观测记录,专为机器学习应用场景而设计。
使用方法
使用本数据集时,可便捷地通过Hugging Face的datasets库进行加载。加载后,数据集被默认为名为'train'的划分,用户可轻松将其转换为Pandas DataFrame形式进行后续操作。若需关注全国总体情况,可通过过滤dim1字段中后缀为'_BTSX'或为空值的行来获取两性综合数据。此外,亦可依据country_iso3字段筛选特定国家的数据,并结合year字段排序,以开展国家层面的时间序列分析与建模工作。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2020年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO),聚焦非洲地区猪只数量的国家级统计指标(NTD_TSOL3),覆盖2016至2020年间44个非洲国家。核心研究问题在于为被忽视的热带病(NTDs)的流行病学建模提供关键宿主密度数据——猪只是绦虫病(taeniasis)与囊虫病(cysticercosis)传播链中的重要中间宿主。作为非洲健康数据统一化、机器学习就绪存储库的一部分,该数据集填补了非洲大陆在畜牧统计与传染病交叉领域的结构化数据空白,推动了区域健康指标的可比性与可计算性。其对相关领域的影响力体现在:为寄生虫病传播动力学、畜牧业管理与公共卫生政策制定提供了标准化、可复用的定量基础,尤其助力WHO非洲区域(AFRO)实现精准干预与资源分配。
当前挑战
该数据集所解决的领域问题挑战在于:非洲地区因数据碎片化、测量标准不一及历史缺失,导致猪只种群数量这一关键宿主参数难以用于传染病传播模型与风险评估。具体挑战包含:1) 跨44国统计口径差异——各国农业普查定义、数据收集周期与报告精度不一,引入系统偏差;2) 时空覆盖稀疏性与置信区间缺失——5年间仅87条观测记录(年均约17国),部分年份国家数据空窗,且置信区间(value_low/value_high)不完整,削弱了时间序列分析与空间插值的稳健性;3) 数据结构化与模型适配——原始WHO API返回的显示字符串(如“58.3 [57.7–59.0]”)需精确解析为浮点数值与置信边界,同时处理维1/维2(如性别、城乡)的缺失或异构编码,确保清洗后的表格化数据可直接服务于回归与分类任务,避免信息损毁或引入扰动。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集所记录的各国猪存栏量是评估猪带绦虫病(Taenia solium)感染风险的关键基础变量。猪带绦虫病是一种被忽视的热带病,其传播与猪群数量、养殖方式及卫生条件密切相关。研究者常利用该数据集构建疾病传播模型,将猪的种群密度作为核心输入参数,结合生态位模型或贝叶斯统计框架,预测绦虫病在非洲不同地区的潜在流行风险。通过跨年度数据(2016–2020年),还能揭示猪群数量波动对寄生虫传播动态的长期影响。
解决学术问题
该数据集有效解决了非洲地区猪带绦虫病量化评估中基础数据匮乏的学术困境。长期以来,由于缺乏系统、公开的猪群统计数据,学者难以对绦虫病的空间分布与流行病学特征进行精确建模。该数据集的发布填补了这一空白,使得研究人员能够从宏观尺度建立猪群密度与疾病负担之间的统计关联,进而检验环境卫生、畜牧政策与人口流动等社会因素对疾病传播的调节效应。其意义在于为公共卫生干预策略的制定提供了可量化的证据基础,推动了被忽视热带病研究的数理化和实证化进程。
实际应用
在实际应用中,该数据集为非洲各国动物卫生监管机构与全球卫生组织提供了决策支持工具。通过分析猪存栏量的空间分布,可以识别出高风险养殖区域,从而协同部署猪带绦虫病的血清学筛查与驱虫治疗计划。此外,结合WHO主导的“2030年被忽视热带病控制路线图”,该数据可用于优化疫苗分发与健康教育资源的配置,提升干预措施的投入产出比。在畜牧业规划方面,猪群数量变动趋势还能为非洲小农户的养殖规模调整及疫病预警系统的建设提供参考依据。
数据集最近研究
最新研究方向
在全球公共卫生与农业交叉领域,非洲地区猪群数量数据集(NTD_TSOL3)正被用于构建人畜共患传染病(如猪囊虫病)的空间流行病学模型,结合气象与土地利用数据,预测疾病传播热点。伴随“同一健康”(One Health)理念的深化,该数据集与非洲猪瘟监测网络联动,支持跨境疫情风险评估。其标准化Parquet格式和低缺失率特性,为机器学习驱动的非洲畜牧健康预警系统提供了高质量训练样本,助力WHO在资源匮乏区域实现精准干预策略的制定。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务