five

electricsheepafrica/africa-world-bank-health-indicators-for-gabon

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-health-indicators-for-gabon
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为加蓬 - 健康,由世界银行集团发布,数据来源于HDX。数据集包含加蓬的国家级健康指标数据,涵盖健康系统、疾病预防、生殖健康、营养和人口动态等方面。数据集的单元观察是国家级聚合数据,总共有8,720行数据,分为训练集(6,976行)和测试集(1,744行)。数据集的特征包括地理信息(如国家名称、ISO3代码、年份)、结果/测量(如值)以及标识符/元数据(如指标名称、指标代码等)。数据集经过Electric Sheep Africa处理,转换为Parquet格式,并进行了标准化和缺失值处理。

annotations_creators: - 无标注 language_creators: - 采集自现有资源 language: - 英语 license: cc-by-4.0 multilinguality: - 单语言 size_categories: - 1000<n<10000 source_datasets: - 原创数据集 task_categories: - 表格分类 task_ids: [] tags: - 非洲 - 人道主义 - 人道主义数据交换(HDX,Humanitarian Data Exchange) - 电动绵羊非洲(electric-sheep-africa) - 卫生健康 - 指标 - 加蓬(GAB) pretty_name: "加蓬——卫生健康" dataset_info: splits: - name: 训练集 num_examples: 6976 - name: 测试集 num_examples: 1744 # 加蓬——卫生健康 **发布方:** 世界银行集团 · **来源:** [人道主义数据交换(HDX,Humanitarian Data Exchange)](https://data.humdata.org/dataset/world-bank-health-indicators-for-gabon) · **授权协议:** `cc-by` · **更新时间:** 2026-03-27 --- ## 摘要 本数据集包含来自世界银行[数据门户](http://data.worldbank.org/)的公开数据。人道主义数据交换(HDX)平台上还提供了一份[整合版国家数据集](https://data.humdata.org/dataset/world-bank-combined-indicators-for-gabon)。 改善健康状况是千年发展目标的核心内容,而公共部门是发展中国家医疗卫生服务的主要供给方。为缩小健康公平差距,诸多国家已将初级卫生保健作为工作重点,其中涵盖免疫接种、环境卫生、安全饮用水获取以及安全分娩相关举措。本数据集涵盖卫生系统、疾病预防、生殖健康、营养与人口动态等领域的数据。数据来源包括联合国人口司、世界卫生组织(WHO,World Health Organization)、联合国儿童基金会(UNICEF,United Nations Children's Fund)、联合国艾滋病规划署(UNAIDS,Joint United Nations Programme on HIV/AIDS)以及其他多个机构。 本数据集的每一行均代表国家层面的汇总统计数据。该数据集在HDX平台的最后更新时间为2026-03-27。地理覆盖范围:**加蓬(GAB)**。 *本数据集已由[电动绵羊非洲(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica)整理为适配机器学习的Parquet格式。* --- ## 数据集特征 | | | |---|---| | **领域** | 公共卫生 | | **观测单元** | 国家层面汇总数据 | | **总行数** | 8720 | | **列数** | 8(2个数值型、6个分类型、0个日期时间型) | | **训练集划分** | 6976行 | | **测试集划分** | 1744行 | | **地理覆盖范围** | 加蓬(GAB) | | **发布方** | 世界银行集团 | | **HDX平台最后更新时间** | 2026-03-27 | --- ## 变量 **地理类变量** — `country_name`(国家名称:加蓬)、`country_iso3`(国家ISO3代码:GAB)、`year`(年份范围:1960.0–2025.0)。 **结果/测量类变量** — `value`(数值范围:0.0–2538952.0)。 **标识符/元数据类变量** — `indicator_name`(指标名称:净移民、15-64岁男性人口占男性总人口比例、30-34岁女性人口占女性总人口比例)、`indicator_code`(指标代码:SM.POP.NETM、SP.POP.1564.MA.ZS、SP.POP.3034.FE.5Y)、`esa_source`(数据来源:HDX)、`esa_processed`(数据处理时间:2026-04-27)。 --- ## 快速上手 python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-health-indicators-for-gabon") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() --- ## 数据结构 | 列名 | 数据类型 | 空值占比 | 取值范围/示例值 | |---|---|---|---| | `country_name` | 对象型 | 0.0% | 加蓬 | | `country_iso3` | 对象型 | 0.0% | GAB | | `year` | 64位整数型 | 0.0% | 1960.0 – 2025.0(均值:1997.8052) | | `indicator_name` | 对象型 | 0.0% | 净移民、15-64岁男性人口占男性总人口比例、30-34岁女性人口占女性总人口比例 | | `indicator_code` | 对象型 | 0.0% | SM.POP.NETM、SP.POP.1564.MA.ZS、SP.POP.3034.FE.5Y | | `value` | 64位浮点型 | 0.0% | 0.0 – 2538952.0(均值:36425.1825) | | `esa_source` | 对象型 | 0.0% | HDX | | `esa_processed` | 对象型 | 0.0% | 2026-04-27 | --- ## 数值型统计量 | 列名 | 最小值 | 最大值 | 均值 | 中位数 | |---|---|---|---|---| | `year` | 1960.0 | 2025.0 | 1997.8052 | 2001.0 | | `value` | 0.0 | 2538952.0 | 36425.1825 | 32.6609 | --- ## 数据整理流程 原始数据通过CKAN应用程序编程接口(CKAN API)从HDX平台下载,并转换为Parquet格式。列名统一转换为小写并标准化为蛇形命名法(snake_case)。将常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)统一替换为`NaN`。本数据集以固定随机种子(42)按80/20的比例划分为训练集与测试集,并保存为Snappy压缩格式的Parquet文件。 --- ## 局限性说明 - 本数据集源自世界银行集团,尚未由电动绵羊非洲(ESA)进行独立验证。 - 自动化清洗流程无法修正原始数据收集中的错报值、定义不一致或抽样偏差问题。 - 如需查看发布方提供的方法说明与免责条款,请参阅[原始HDX数据集页面](https://data.humdata.org/dataset/world-bank-health-indicators-for-gabon)。 --- ## 引用格式 bibtex @dataset{hdx_africa_world_bank_health_indicators_for_gabon, title = {Gabon - Health}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-health-indicators-for-gabon}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } --- *[电动绵羊非洲(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica) — 非洲的机器学习数据集基础设施。尼日利亚拉各斯。*
提供机构:
electricsheepafrica
二维码
社区交流群
二维码
科研交流群
商业服务