five

africa-world-bank-social-protection-and-labor-indicators-for-gambia-the

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-world-bank-social-protection-and-labor-indicators-for-gambia-the
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“冈比亚 - 社会保障与劳动”,由世界银行集团发布,并由Electric Sheep Africa整理为适合机器学习的格式。数据集包含冈比亚国家层面的社会保障与劳动指标,涵盖1983年至2025年的数据。数据内容包括劳动力参与率(男性、女性及总体)、女性与男性劳动力参与率比率等指标。数据集共3,774行,分为训练集(3,019行)和测试集(754行),包含8个字段(2个数值型,6个分类型)。字段包括国家名称、ISO3代码、年份、指标名称、指标代码、数值、数据来源和处理日期。数据集适用于人道主义和发展数据分析任务,特别是与劳动力市场和社会经济指标相关的研究。数据经过标准化处理,缺失值统一标记为NaN,并以Snappy压缩的Parquet格式存储。
创建时间:
2026-04-11
原始信息汇总

数据集概述:Gambia, The - Social Protection and Labor

基本信息

  • 数据集名称:Gambia, The - Social Protection and Labor
  • 发布者:World Bank Group
  • 数据来源:HDX (https://data.humdata.org/dataset/world-bank-social-protection-and-labor-indicators-for-gambia-the)
  • 许可证:cc-by-4.0
  • 语言:英语
  • 地理范围:GMB (冈比亚)
  • 数据最后更新日期 (HDX):2026-03-27
  • 数据处理日期:2026-04-11
  • 数据整理方:Electric Sheep Africa (https://huggingface.co/electricsheepafrica)

数据集特征

  • 领域:人道主义与发展数据
  • 观察单位:国家层面汇总数据
  • 总行数:3,774
  • 列数:8 (2个数值型,6个类别型,0个日期时间型)
  • 训练集:3,019 行
  • 测试集:754 行

变量说明

  • 地理信息
    • country_name:国家名称 (Gambia, The)
    • country_iso3:国家ISO3代码 (GMB)
    • year:年份 (范围:1983.0–2025.0)
  • 结果/测量值
    • value:指标数值 (范围:-0.2041–872199.0)
  • 标识符/元数据
    • indicator_name:指标名称,包含:
      • Labor force participation rate, male (% of male population ages 15-64) (modeled ILO estimate)
      • Ratio of female to male labor force participation rate (%) (modeled ILO estimate)
      • Labor force participation rate, total (% of total population ages 15-64) (modeled ILO estimate)
    • indicator_code:指标代码 (SL.TLF.ACTI.MA.ZS, SL.TLF.CACT.FM.ZS, SL.TLF.ACTI.ZS)
    • esa_source:数据来源 (HDX)
    • esa_processed:数据处理日期 (2026-04-11)

数据模式

列名 类型 空值百分比 范围/示例值
country_name object 0.0% Gambia, The
country_iso3 object 0.0% GMB
year int64 0.0% 1983.0 – 2025.0 (均值 2008.5427)
indicator_name object 0.0% Labor force participation rate, male (% of male population ages 15-64) (modeled ILO estimate), Ratio of female to male labor force participation rate (%) (modeled ILO estimate), Labor force participation rate, total (% of total population ages 15-64) (modeled ILO estimate)
indicator_code object 0.0% SL.TLF.ACTI.MA.ZS, SL.TLF.CACT.FM.ZS, SL.TLF.ACTI.ZS
value float64 0.0% -0.2041 – 872199.0 (均值 11866.8881)
esa_source object 0.0% HDX
esa_processed object 0.0% 2026-04-11

数值摘要

列名 最小值 最大值 均值 中位数
year 1983.0 2025.0 2008.5427 2010.0
value -0.2041 872199.0 11866.8881 19.5045

数据整理流程

原始数据通过CKAN API从HDX下载并转换为Parquet格式。列名被转换为小写和蛇形命名法。常见的缺失值标记被统一为NaN。数据集使用固定的随机种子(42)按80/20的比例划分为训练集和测试集,并保存为Snappy压缩的Parquet文件。

使用限制

  • 数据源自世界银行集团,未经ESA独立验证。
  • 自动清洗无法纠正原始收集中误报的值、定义不一致或抽样偏差。
  • 有关发布者自身的方法说明和注意事项,请参考原始HDX数据集页面 (https://data.humdata.org/dataset/world-bank-social-protection-and-labor-indicators-for-gambia-the)。

引用格式

bibtex @dataset{hdx_africa_world_bank_social_protection_and_labor_indicators_for_gambia_the, title = {Gambia, The - Social Protection and Labor}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-social-protection-and-labor-indicators-for-gambia-the}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在社会科学与经济发展研究领域,数据集的构建往往依赖于权威国际机构的系统性数据收集。本数据集源自世界银行集团,通过其数据门户整合了冈比亚的社会保护与劳动力指标。原始数据经由人道主义数据交换平台获取,并由Electric Sheep Africa团队进行专业化处理,包括通过CKAN API下载、统一缺失值标记、标准化列名为蛇形命名法,并转换为Parquet格式。数据涵盖1983年至2025年的国家层面聚合观测,最终按80/20比例使用固定随机种子划分为训练集与测试集,确保了数据在机器学习应用中的直接可用性与可复现性。
特点
该数据集聚焦于冈比亚的社会保护与劳动力市场动态,体现了在非洲发展研究中的典型数据特征。其核心特点在于以国家为观测单位,包含三个关键指标:男性劳动力参与率、女性与男性劳动力参与率之比以及总体劳动力参与率,均由国际劳工组织模型化估计得出。数据集结构简洁,共8个变量,涵盖地理标识、年份、指标名称与数值,且无缺失值,保证了数据的完整性。数值范围从-0.2041至872199.0,反映了指标间的尺度差异,而时间跨度长达四十余年,为纵向分析提供了丰富的时间序列基础。
使用方法
在应用机器学习方法研究社会经济指标时,本数据集提供了便捷的接入途径。用户可通过Hugging Face的datasets库直接加载数据,利用Python环境将数据转换为Pandas DataFrame以进行后续分析。数据集已预分割为训练集与测试集,适用于时间序列预测、指标相关性分析或社会经济建模等任务。研究者可依据年份、指标代码等变量进行筛选与聚合,探索劳动力市场趋势。需要注意的是,数据源自世界银行,使用时需参考原发布方的方法论说明,并考虑指标定义与收集可能存在的局限性,以确保分析结论的稳健性。
背景与挑战
背景概述
在全球化与区域发展研究领域,社会保护与劳动力市场指标是评估国家经济韧性、社会福利水平及可持续发展进程的核心依据。世界银行集团作为国际发展数据的重要权威机构,长期致力于构建并维护覆盖全球的社会经济指标体系。该数据集由世界银行集团发布,并由Electric Sheep Africa于2026年重新整理为机器学习可用格式,聚焦于冈比亚的社会保护与劳动力指标。其核心研究问题在于通过标准化的国家层面聚合数据,揭示劳动力参与率、性别平等比率等关键指标的历史演变与现状,为发展经济学、公共政策分析及人道主义干预提供实证基础。该数据集的建立深化了对非洲国家劳动力市场动态的理解,尤其为针对冈比亚的微观经济研究与宏观政策制定提供了连续、可比较的数据支撑。
当前挑战
该数据集旨在解决社会保护与劳动力市场领域的量化分析挑战,其核心在于通过国家层面指标追踪劳动力结构、性别差异及经济参与度的长期趋势。然而,领域问题本身存在多重复杂性:劳动力定义在不同国家与国际组织间存在差异,例如无偿工作者、家庭劳动者或武装力量成员是否纳入统计,可能导致跨区域比较时的系统性偏差;模型估计数据依赖于国际劳工组织的建模假设,可能无法完全捕捉实地调查的细微动态。在构建过程中,数据集面临原始数据整合的挑战,包括统一缺失值标记、处理定义不一致性以及纠正报告错误,而自动化清洗流程难以识别原始收集中潜在的抽样偏差或方法论局限,这些因素均可能影响后续机器学习模型的泛化能力与政策推断的可靠性。
常用场景
经典使用场景
在社会科学与经济发展研究领域,该数据集为分析冈比亚劳动力市场动态提供了关键数据支撑。研究者通常利用其时间序列特征,追踪1983年至2025年间劳动力参与率、性别差异等核心指标的演变轨迹,构建计量经济模型以揭示宏观经济政策与社会保护措施对就业结构的影响机制。
衍生相关工作
该数据集的标准化格式催生了多项机器学习应用研究,如Electric Sheep Africa团队开发的非洲国家指标预测管道。学者们常将其与教育投入、卫生支出等跨领域数据集进行融合分析,产生如《西非劳动力市场韧性研究》等专题报告,世界银行年度发展报告也多次引用该数据支撑其区域就业趋势分析章节。
数据集最近研究
最新研究方向
在非洲发展经济学与数据科学交叉领域,冈比亚的社会保护与劳动力指标数据集正推动前沿研究。学者们利用此类精细化国别数据,结合机器学习方法探索劳动力市场动态与性别平等议题,特别是女性劳动参与率与经济增长的关联机制。随着联合国可持续发展目标(SDGs)的推进,该数据集为评估非洲国家在体面劳动与社会包容方面的进展提供了关键实证基础,助力政策模拟与影响评估,成为发展干预措施效果量化研究的热点工具。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务