africa-cpv-views-conflict-forecasts
收藏Cabo Verde - VIEWS冲突预测数据集概述
基本信息
- 数据集名称:Cabo Verde - VIEWS conflict forecasts
- 发布者:Violence & Impacts Early-Warning System
- 数据来源:HDX (https://data.humdata.org/dataset/cpv-views-conflict-forecasts)
- 许可证:cc-by-sa-4.0
- 语言:英语
- 多语言性:单语
- 数据规模:n<1K
- 任务类别:表格分类、表格回归
- 标签:africa, humanitarian, hdx, electric-sheep-africa, conflict-violence, fatalities, forecasting, hxl, cpv
数据集特征
- 领域:冲突与安全
- 观测单位:国家级汇总数据
- 总行数:36
- 列数:12(8个数值型,4个类别型,0个日期时间型)
- 训练集:28行
- 测试集:7行
- 地理范围:CPV(佛得角)
- HDX最后更新日期:2026-04-01
数据内容
- 地理变量:
country_id(范围40.0–40.0)、isoab(CPV)、year(范围2026.0–2029.0) - 时间变量:
month_id(范围555.0–590.0)、month(范围1.0–12.0) - 标识符/元数据:
name(Cape Verde)、gwcode(范围402.0–402.0)、esa_source(HDX)、esa_processed(2026-04-08) - 其他变量:
main_mean_ln(范围0.0041–0.161)、main_mean(范围0.0041–0.1747)、main_dich(范围0.0–0.0)
数据模式
| 列名 | 类型 | 空值比例 | 范围/示例值 |
|---|---|---|---|
country_id |
int64 | 0.0% | 40.0 – 40.0 (均值 40.0) |
month_id |
int64 | 0.0% | 555.0 – 590.0 (均值 572.5) |
name |
object | 0.0% | Cape Verde |
gwcode |
int64 | 0.0% | 402.0 – 402.0 (均值 402.0) |
isoab |
object | 0.0% | CPV |
year |
int64 | 0.0% | 2026.0 – 2029.0 (均值 2027.1667) |
month |
int64 | 0.0% | 1.0 – 12.0 (均值 6.5) |
main_mean_ln |
float64 | 0.0% | 0.0041 – 0.161 (均值 0.1086) |
main_mean |
float64 | 0.0% | 0.0041 – 0.1747 (均值 0.1161) |
main_dich |
float64 | 0.0% | 0.0 – 0.0 (均值 0.0) |
esa_source |
object | 0.0% | HDX |
esa_processed |
object | 0.0% | 2026-04-08 |
数据摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
country_id |
40.0 | 40.0 | 40.0 | 40.0 |
month_id |
555.0 | 590.0 | 572.5 | 572.5 |
gwcode |
402.0 | 402.0 | 402.0 | 402.0 |
year |
2026.0 | 2029.0 | 2027.1667 | 2027.0 |
month |
1.0 | 12.0 | 6.5 | 6.5 |
main_mean_ln |
0.0041 | 0.161 | 0.1086 | 0.1317 |
main_mean |
0.0041 | 0.1747 | 0.1161 | 0.1408 |
main_dich |
0.0 | 0.0 | 0.0 | 0.0 |
数据整理
原始数据通过CKAN API从HDX下载并转换为Parquet格式。列名被转换为小写和蛇形命名法。常见的缺失值标记被统一为NaN。数据集使用固定随机种子(42)按80/20的比例分割为训练集和测试集,并保存为Snappy压缩的Parquet文件。
使用方式
python from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-cpv-views-conflict-forecasts") train = ds["train"].to_pandas() test = ds["test"].to_pandas()
print(train.shape) train.head()
局限性
- 数据来源于Violence & Impacts Early-Warning System,未经ESA独立验证。
- 自动清洗无法纠正原始收集中误报的值、定义不一致或抽样偏差。
- 有关发布者自身的方法说明和注意事项,请参考原始HDX数据集页面。
引用
bibtex @dataset{hdx_africa_cpv_views_conflict_forecasts, title = {Cabo Verde - VIEWS conflict forecasts}, author = {Violence & Impacts Early-Warning System}, year = {2026}, url = {https://data.humdata.org/dataset/cpv-views-conflict-forecasts}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }




