five

electricsheepafrica/africa-social-development-gambia

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-social-development-gambia
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为冈比亚 - 社会发展,由世界银行集团发布,来源于HDX平台。数据集涵盖了冈比亚的社会发展指标,包括儿童劳动、性别问题、难民和寻求庇护者等。数据来自国际劳工组织(ILO)、联合国儿童基金会(UNICEF)、世界银行和国家统计机构的家庭调查。数据集包含国家层面的聚合数据,每个数据行代表一个国家级别的汇总。数据集被分为训练集和测试集,分别包含690和172个样本。数据集的特征包括地理信息(如国家名称、国家ISO3代码、年份)、结果/测量(如值)和标识符/元数据(如指标名称、指标代码、来源等)。数据集经过整理,转换为Parquet格式,并进行了标准化和缺失值处理。

annotations_creators: - 无注释 language_creators: - 采集所得 language: - 英语 license: cc-by-4.0 multilinguality: - 单语言 size_categories: - 样本数少于1000 source_datasets: - 原始数据集 task_categories: - 表格分类 task_ids: [] tags: - 非洲 - 人道主义 - HDX(Humanitarian Data Exchange,HDX) - electric-sheep-africa - 发展 - 指标 - GMB pretty_name: "冈比亚——社会发展" dataset_info: splits: - name: train num_examples: 690 - name: test num_examples: 172 --- # 冈比亚——社会发展 **发布方:** 世界银行集团 · **数据源:** [HDX(Humanitarian Data Exchange,HDX)](https://data.humdata.org/dataset/world-bank-social-development-indicators-for-gambia-the) · **许可协议:** `CC BY` · **更新时间:** 2026-03-27 --- ## 摘要 本数据集包含源自世界银行[数据门户](http://data.worldbank.org/)的相关数据。HDX平台上另有一份[冈比亚综合国家数据集](https://data.humdata.org/dataset/world-bank-combined-indicators-for-gambia-the)。 本数据集覆盖童工、性别议题、难民与寻求庇护者相关数据。全球多国儿童长期劳作,往往需要兼顾学业与有偿工作。这类有偿工作相关数据来自国际劳工组织(International Labour Organization, ILO)、联合国儿童基金会(United Nations Children's Fund, UNICEF)、世界银行以及各国统计机构开展的家庭调查。性别不平等程度通过教育、健康、劳动力参与率、政治参与等核心议题的汇总数据进行衡量。难民相关数据来自联合国难民署(United Nations High Commissioner for Refugees, UNHCR),并补充了由联合国近东巴勒斯坦难民救济和工程处(United Nations Relief and Works Agency)负责的巴勒斯坦难民统计数据。 本数据集的每一行均代表国家层面的汇总数据。本数据集最近一次在HDX平台的更新时间为2026-03-27。地理覆盖范围:**GMB**。 *本数据集已由[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为机器学习可用的Parquet格式。* --- ## 数据集特征 | | | |---|---| | **领域** | 公共卫生 | | **观测单元** | 国家层面汇总数据 | | **总样本行数** | 863 | | **列数** | 8列(2个数值型、6个分类型、0个日期时间型) | | **训练集划分** | 690行 | | **测试集划分** | 172行 | | **地理覆盖范围** | GMB | | **发布方** | 世界银行集团 | | **HDX平台最后更新时间** | 2026-03-27 | --- ## 变量说明 **地理标识类** — `country_name`(国家名称:冈比亚)、`country_iso3`(国家ISO3代码:GMB)、`year`(年份:范围1960.0–2025.0)。 **结果/测量类** — `value`(指标数值:范围0.1–197.9)。 **标识符/元数据类** — `indicator_name`(指标名称:男性出生时预期寿命(年)、女性出生时预期寿命(年)、青少年生育率(每1000名15-19岁女性的活产数))、`indicator_code`(指标代码:SP.DYN.LE00.MA.IN、SP.DYN.LE00.FE.IN、SP.ADO.TFRT)、`esa_source`(数据来源:HDX)、`esa_processed`(数据处理时间:2026-04-27)。 --- ## 快速上手 python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-social-development-gambia") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() --- ## 数据结构 | 列名 | 数据类型 | 空值占比 | 取值范围/示例值 | |---|---|---|---| | `country_name` | 字符串(object) | 0.0% | 冈比亚 | | `country_iso3` | 字符串(object) | 0.0% | GMB | | `year` | 64位整数(int64) | 0.0% | 1960.0 – 2025.0(均值2002.2851) | | `indicator_name` | 字符串(object) | 0.0% | 男性出生时预期寿命(年)、女性出生时预期寿命(年)、青少年生育率(每1000名15-19岁女性的活产数) | | `indicator_code` | 字符串(object) | 0.0% | SP.DYN.LE00.MA.IN、SP.DYN.LE00.FE.IN、SP.ADO.TFRT | | `value` | 64位浮点数(float64) | 0.0% | 0.1 – 197.9(均值41.0017) | | `esa_source` | 字符串(object) | 0.0% | HDX | | `esa_processed` | 字符串(object) | 0.0% | 2026-04-27 | --- ## 数值型统计摘要 | 列名 | 最小值 | 最大值 | 均值 | 中位数 | |---|---|---|---|---| | `year` | 1960.0 | 2025.0 | 2002.2851 | 2004.0 | | `value` | 0.1 | 197.9 | 41.0017 | 41.246 | --- ## 数据整理流程 原始数据通过CKAN API从HDX平台下载,并转换为Parquet格式。列名统一转换为小写并遵循蛇形命名法(snake_case)。常见缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)被统一替换为`NaN`。本数据集以固定随机种子(42)按照80/20的比例划分为训练集与测试集,并保存为Snappy压缩格式的Parquet文件。 --- ## 局限性说明 - 本数据源自世界银行集团,未经过Electric Sheep Africa的独立验证。 - 自动化清洗流程无法修正原始数据收集中的错报值、定义不一致或抽样偏差问题。 - 请参阅[HDX平台原始数据集页面](https://data.humdata.org/dataset/world-bank-social-development-indicators-for-gambia-the)获取发布方提供的方法说明与注意事项。 --- ## 引用格式 bibtex @dataset{hdx_africa_social_development_gambia, title = {Gambia, The - Social Development}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-social-development-indicators-for-gambia-the}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施平台,尼日利亚拉各斯。*
提供机构:
electricsheepafrica
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作