five

electricsheepafrica/africa-ilo-emp-tour-sex-edu-nb-tourism-sector-employment-by-sex-and-education-tho

收藏
Hugging Face2026-05-29 更新2026-05-31 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-ilo-emp-tour-sex-edu-nb-tourism-sector-employment-by-sex-and-education-tho
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自国际劳工组织(ILO)ILOSTAT数据库的旅游业就业数据,具体指标为按性别和教育水平划分的旅游业就业人数(以千计),覆盖23个非洲国家,时间跨度为2009年至2025年,共有1,069个观测值。数据通过ILOSTAT REST API获取,并过滤到非洲国家代码,经过ILO的统计方法协调,确保数据可比性。数据集包括国家代码、国家名称、数据来源、指标代码、性别分类、教育水平分类、观测年份、观测值、数据状态标志等列,适用于表格分类、回归和时间序列预测等任务。数据以年度频率发布,并包含数据质量说明,如使用ILO选择的“最佳来源”处理多源数据。

This dataset contains tourism sector employment data from the International Labour Organization (ILO) ILOSTAT database, specifically the indicator for employment by sex and education (in thousands), covering 23 African countries from 2009 to 2025, with 1,069 observations. Data is pulled directly from the ILOSTAT REST API and filtered to Africa ISO3 country codes, harmonized using ILO statistical methods for comparability. The dataset includes columns such as country code, country name, data source, indicator code, sex disaggregation, education level classification, observation year, observed value, and data status flags, suitable for tasks like tabular classification, regression, and time-series forecasting. Data is published at annual frequency and includes quality caveats, such as using the ILO-selected best source for multiple sources per country-year.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于国际劳工组织(ILO)的ILOSTAT统计数据库,经由Electric Sheep Africa团队重新封装后发布至HuggingFace平台。原始数据通过ILOSTAT REST API直接获取,接口地址为`https://rplumber.ilo.org/data/indicator?id=EMP_TOUR_SEX_EDU_NB`,随后依据非洲ISO3国家代码进行过滤与抽取。ILOSTAT自身采用国际劳工统计学家会议(ICLS)定义的标准对各国劳动力调查、家庭收支调查、企业调查及行政记录等微观数据进行协调与整合,从而确保跨国可比性。数据集中每一条观测值均附带来源标签(`source.label`),以便用户追溯原始数据出处。
特点
本数据集聚焦于非洲23个国家旅游业从业人员的就业状况,涵盖2009年至2025年间的1,069条观测记录,包含性别与教育水平两个核心分类维度。数据以年频率呈现,每个观测值对应特定国家、年份、性别群体及教育层次的旅游业就业人数(单位:千人)。除基础指标值(`obs_value`)外,数据集还提供了丰富的元数据字段,如观测状态标志(`obs_status`)、系列中断与方法修订注释(`note_indicator.label`)以及非标准教育水平说明(`note_classif.label`),为数据质量评估提供了重要参考。此外,数据集采用CC-BY-4.0许可协议,方便学术与商业用户自由使用。
使用方法
用户可通过HuggingFace的`datasets`库便捷地加载该数据集,仅需一行代码`load_dataset('electricsheepafrica/africa-ilo-emp-tour-sex-edu-nb-tourism-sector-employment-by-sex-and-education-tho')`即可获取训练集,并迅速转换为Pandas DataFrame格式以供分析。针对特定国家的筛选,可对`ref_area`字段进行条件过滤,如`df[df['ref_area'] == 'KEN']`。若需开展时间序列分析,则可将数据按`time`字段排序后绘制趋势图。此外,数据集支持基于`indicator`字段的透视表操作,例如按年份与国家构建矩阵以便进行面板数据分析。推荐用户在使用时同时引用ILO原始数据及Electric Sheep Africa的重新封装版本。
背景与挑战
背景概述
该数据集由国际劳工组织(ILO)下属的ILOSTAT数据库整理,并经Electric Sheep Africa于2025年重新打包发布,聚焦于非洲23个国家2009至2025年间旅游业就业的性别与教育程度细分数据,共包含1069条观测记录。旅游业作为非洲经济的重要支柱,其就业结构的性别与教育维度分析对理解区域劳动力市场动态、评估可持续发展目标(SDG)中体面工作指标具有关键价值。通过提供标准化的分类变量(如性别和教育层级),该数据集为跨国家、跨时间序列的比较研究奠定了数据基础。
当前挑战
该领域面临的核心挑战在于非洲各国旅游业就业数据的稀疏性与不均衡性,仅有23个非洲国家提供覆盖指定时间段的完整记录,且数据频率仅为年度,缺失更精细的季度或月度波动信息。构建过程中的挑战包括处理来自不同来源调查的微观数据异质性,需通过ILO的ICLS定义进行统计口径统一,同时应对指标值被标记为‘不可靠’或序列间断等质量问题。此外,性别和教育程度的细分维度在部分国家观测中缺失,导致聚合分析时面临严重的有效样本缩减问题。
常用场景
经典使用场景
该数据集最经典的使用场景在于对非洲国家旅游业就业结构进行多维度分析。通过性别和教育程度两个核心分类变量,研究者能够系统刻画旅游部门从业人口的基本特征,揭示不同性别群体在旅游业中的参与差异,以及教育水平对就业质量的影响。由于数据跨越2009至2025年,支持构建时间序列模型,分析旅游业就业的动态演变趋势,并可用于面板数据回归,探索经济政策、国际游客流量等宏观因素对就业的影响。此外,数据集还适用于分类任务,预测不同国家在不同年份的就业规模等级,或进行回归分析以估算特定国家旅游业的就业吸纳能力。
实际应用
在实际应用层面,该数据集为国家旅游经济发展规划和劳动政策制定提供了坚实的决策依据。各国旅游部门可以据此评估本国旅游业对不同性别群体的就业拉动效果,设计更具包容性的职业培训和技能提升项目。对于国际发展机构而言,数据可辅助识别非洲各国在旅游业就业质量上的差异,从而精准配置援助资源。企业层面,跨国旅游集团能够利用该数据预测目的地市场的劳动力供给结构,优化招聘和人力资源配置策略。此外,教育机构可结合数据趋势调整旅游管理专业的课程设置,使之更贴合行业实际需求,缩小教育与就业市场之间的鸿沟。
衍生相关工作
围绕该数据集已衍生出多项具有影响力的研究工作。在劳动经济学领域,学者利用该数据构建了非洲旅游业就业弹性模型,量化经济增长与就业增长之间的关系,为区域一体化政策提供量化支撑。性别研究方面,有工作基于该数据分析了撒哈拉以南非洲旅游业女性就业的时空演变格局,揭示了文化、法律与社会规范对女性从业者的差异化影响。在时间序列预测方向,研究者尝试融合ILOSTAT的多源数据,开发基于注意力机制的深度学习模型,对旅游业就业进行短期预测。此外,该数据还被整合进非洲可持续发展目标评估平台,作为监测SDG目标8.9(体面工作与经济增长)进展的核心指标来源。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务