asia-social-protection-world-bank-social-protection-and-labor-i
收藏数据集概述:Turkiye - Social Protection and Labor
该数据集来源于世界银行集团,并由 Electric Sheep Africa 整理为机器学习友好的 Parquet 格式。数据集关注土耳其(Turkiye)的社会保护与劳动力指标,包含劳动力供应、失业率等国家层面的汇总数据。数据通过人道主义数据交换平台(HDX)获取,最后更新于 2026-04-28。
数据集特征
| 属性 | 值 |
|---|---|
| 领域 | 人道主义与发展数据 |
| 观察单位 | 国家层面汇总 |
| 总行数 | 20,957 |
| 列数 | 8(2 个数值型,6 个分类型,0 个日期时间型) |
| 训练集 | 16,765 行 |
| 测试集 | 4,191 行 |
| 地理范围 | TUR(土耳其) |
| 发布者 | 世界银行集团 |
| HDX 最后更新 | 2026-04-28 |
| 许可证 | CC-BY-4.0 |
变量说明
- 地理变量:
country_name(Turkiye)、country_iso3(TUR)、year(1960.0–2025.0) - 结果/测量变量:
value(0.0–36818130.0,均值 46187.4155,中位数 12.3883) - 标识符/元数据变量:
indicator_name(如女性失业率、男性失业率、总失业率)、indicator_code(如 SL.UEM.TOTL.FE.NE.ZS)、esa_source(HDX)、esa_processed(2026-05-05)
数值摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
year |
1960.0 | 2025.0 | 2011.0304 | 2011.0 |
value |
0.0 | 36818130.0 | 46187.4155 | 12.3883 |
数据整理说明
原始数据通过 CKAN API 从 HDX 下载并转换为 Parquet 格式。列名被转换为小写并标准化为蛇形命名法(snake_case)。常见的缺失值标记(如 N/A、null、none、-、unknown、no data、#N/A)统一为 NaN。数据集按 80/20 比例随机拆分为训练集和测试集(随机种子 fixed 为 42),并保存为 Snappy 压缩的 Parquet 文件。
局限性
- 数据来源于世界银行集团,未经 Electric Sheep Africa 独立验证。
- 自动清洗无法纠正原始收集中的误报、定义不一致或抽样偏差。
- 请参考原始 HDX 数据集页面以获取发布者的方法论说明和注意事项。
引用格式
bibtex @dataset{hdx_asia_social_protection_world_bank_social_protection_and_labor_i, title = {Turkiye - Social Protection and Labor}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-social-protection-and-labor-indicators-for-turkiye}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }




