africa-displacement-congo-dem-rep
收藏数据集概述:刚果民主共和国 IOM 流离失所追踪矩阵(DTM)
数据集名称:Democratic Republic of the Congo IOM Displacement Tracking Matrix (DTM) from API
发布机构:国际移民组织 (IOM)
数据来源:HDX
许可证:hdx-other
更新日期:2026-04-27
地理范围:COD(刚果民主共和国)
总行数:4,695 行
列数:23 列(8 个数值型,14 个类别型,1 个日期时间型)
数据集说明
本数据集来源于国际移民组织 (IOM) 流离失所追踪矩阵 (DTM) 的公开 API。该 API 向人道主义社区、学术界、媒体、政府和非政府组织提供 DTM 收集的数据。DTM API 仅提供非敏感的国内流离失所者 (IDP) 数据,汇总在国家、Admin 1(省份或同等行政区)和 Admin 2(更小的次国家行政区)级别。每个数据行代表次国家行政单位的观测值,时间覆盖范围由 reportingdate 列指示。
数据集划分
- 训练集 (train):3,756 行
- 测试集 (test):939 行
变量说明
- 地理变量:
admin0name(刚果民主共和国)、admin0pcode(COD)、admin1name(北基伍、南基伍、坦噶尼喀)、admin1pcode(COD61、COD62、COD74)、admin2name(马西西、鲁丘鲁、瓦利卡莱)等 - 时间变量:
reportingdate、monthreportingdate(范围 1.0–12.0) - 人口变量:
numbermales(范围 0.0–926698.0)、numberfemales(范围 -90.0–1358339.0) - 结果/测量变量:
roundnumber(范围 1.0–48.0) - 标识符/元数据变量:
id(范围 155.0–150161.0)、numpresentidpind(范围 1.0–4376465.0)、esa_source、esa_processed - 其他变量:
operation(全国监测、北基伍、M23危机应对)、operationstatus
数值型列统计摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
id |
155.0 | 150161.0 | 63635.0185 | 58515.5 |
adminlevel |
0.0 | 2.0 | 1.5216 | 2.0 |
numpresentidpind |
1.0 | 4376465.0 | 72425.3994 | 3692.0 |
yearreportingdate |
2016.0 | 2026.0 | 2022.7425 | 2023.0 |
monthreportingdate |
1.0 | 12.0 | 7.3333 | 8.0 |
roundnumber |
1.0 | 48.0 | 12.3957 | 6.0 |
numbermales |
0.0 | 926698.0 | 31158.4159 | 1460.0 |
numberfemales |
-90.0 | 1358339.0 | 44591.5652 | 2149.0 |
数据整理说明
原始数据通过 CKAN API 从 HDX 下载,并转换为 Parquet 格式。列名统一为小写和下划线命名法。常见的缺失值标记(N/A、null、none、-、unknown、no data、#N/A)统一为 NaN。基于解析成功率(>85% 阈值),1 列从字符串转为数值或日期时间类型。数据集使用固定随机种子 (42) 按 80/20 比例拆分为训练集和测试集,并保存为 Snappy 压缩的 Parquet 文件。
局限性说明
- 数据来源于国际移民组织 (IOM),未经 Electric Sheep Africa (ESA) 独立验证。
- 自动清理无法纠正原始收集中误报的值、定义不一致或采样偏差。
- 以下列缺失值超过 20%,在建模中应谨慎使用:
admin2name、admin2pcode、numbermales、numberfemales。
引用格式
bibtex @dataset{hdx_africa_displacement_congo_dem_rep, title = {Democratic Republic of the Congo IOM Displacement Tracking Matrix (DTM) from API}, author = {International Organization for Migration (IOM)}, year = {2026}, url = {https://data.humdata.org/dataset/cod-iom-dtm-from-api}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }




