africa-stp-views-conflict-forecasts
收藏Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-stp-views-conflict-forecasts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为“圣多美和普林西比 - VIEWS冲突预测”,由Violence & Impacts Early-Warning System(VIEWS)发布,旨在提供圣多美和普林西比(STP)未来三年的月度冲突预测。数据集包含36行数据,每行代表国家层面的聚合数据,共有12个列(8个数值型,4个分类型)。数据集分为训练集(28行)和测试集(7行)。主要变量包括地理标识(如country_id、isoab)、时间标识(如year、month_id)、元数据(如name、gwcode)以及冲突预测相关指标(如main_mean_ln、main_mean)。数据集适用于表格分类和回归任务,特别适用于冲突预测和人道主义研究领域。数据来源于HDX平台,经过Electric Sheep Africa整理为Parquet格式,并进行了标准化处理。
创建时间:
2026-04-08
原始信息汇总
数据集概述
基本信息
- 数据集名称:Sao Tome and Principe - VIEWS conflict forecasts
- 发布者:Violence & Impacts Early-Warning System
- 数据来源:HDX (https://data.humdata.org/dataset/stp-views-conflict-forecasts)
- 许可证:cc-by-sa-4.0
- 语言:英语
- 多语言性:单语
- 数据规模:n<1K
- 任务类别:表格分类、表格回归
- 标签:africa, humanitarian, hdx, electric-sheep-africa, conflict-violence, fatalities, forecasting, hxl, stp
- 最后更新日期(HDX):2026-04-01
- ML格式处理者:Electric Sheep Africa (https://huggingface.co/electricsheepafrica)
数据集内容
- 领域:冲突与安全
- 观察单位:国家级汇总数据
- 地理范围:STP(圣多美和普林西比)
- 总行数:36
- 总列数:12(8个数值型,4个类别型,0个日期时间型)
- 数据分割:
- 训练集:28行
- 测试集:7行
变量说明
- 地理变量:
country_id(范围80.0–80.0),isoab(STP),year(范围2026.0–2029.0) - 时间变量:
month_id(范围555.0–590.0),month(范围1.0–12.0) - 标识符/元数据:
name(Sao Tome and Principe),gwcode(范围403.0–403.0),esa_source(HDX),esa_processed(2026-04-08) - 其他变量:
main_mean_ln(范围0.0045–0.1585),main_mean(范围0.0046–0.1717),main_dich(范围0.0–0.0)
数据模式
| 列名 | 类型 | 空值百分比 | 范围/示例值 |
|---|---|---|---|
country_id |
int64 | 0.0% | 80.0 – 80.0 (均值 80.0) |
month_id |
int64 | 0.0% | 555.0 – 590.0 (均值 572.5) |
name |
object | 0.0% | Sao Tome and Principe |
gwcode |
int64 | 0.0% | 403.0 – 403.0 (均值 403.0) |
isoab |
object | 0.0% | STP |
year |
int64 | 0.0% | 2026.0 – 2029.0 (均值 2027.1667) |
month |
int64 | 0.0% | 1.0 – 12.0 (均值 6.5) |
main_mean_ln |
float64 | 0.0% | 0.0045 – 0.1585 (均值 0.1075) |
main_mean |
float64 | 0.0% | 0.0046 – 0.1717 (均值 0.1149) |
main_dich |
float64 | 0.0% | 0.0 – 0.0 (均值 0.0) |
esa_source |
object | 0.0% | HDX |
esa_processed |
object | 0.0% | 2026-04-08 |
数值摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
country_id |
80.0 | 80.0 | 80.0 | 80.0 |
month_id |
555.0 | 590.0 | 572.5 | 572.5 |
gwcode |
403.0 | 403.0 | 403.0 | 403.0 |
year |
2026.0 | 2029.0 | 2027.1667 | 2027.0 |
month |
1.0 | 12.0 | 6.5 | 6.5 |
main_mean_ln |
0.0045 | 0.1585 | 0.1075 | 0.1319 |
main_mean |
0.0046 | 0.1717 | 0.1149 | 0.141 |
main_dich |
0.0 | 0.0 | 0.0 | 0.0 |
数据处理
- 原始数据通过CKAN API从HDX下载并转换为Parquet格式。
- 列名被转换为小写和蛇形命名法。
- 常见的缺失值标记被统一为
NaN。 - 数据集使用固定的随机种子(42)按80/20的比例分割为训练集和测试集,并保存为Snappy压缩的Parquet文件。
使用说明
python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-stp-views-conflict-forecasts") train = ds["train"].to_pandas() test = ds["test"].to_pandas()
局限性
- 数据来源于Violence & Impacts Early-Warning System,未经ESA独立验证。
- 自动清洗无法纠正原始收集中误报的值、定义不一致或抽样偏差。
- 有关发布者自身的方法说明和注意事项,请参考原始HDX数据集页面(https://data.humdata.org/dataset/stp-views-conflict-forecasts)。
引用
bibtex @dataset{hdx_africa_stp_views_conflict_forecasts, title = {Sao Tome and Principe - VIEWS conflict forecasts}, author = {Violence & Impacts Early-Warning System}, year = {2026}, url = {https://data.humdata.org/dataset/stp-views-conflict-forecasts}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }
搜集汇总
数据集介绍

构建方式
在冲突预测研究领域,数据质量直接影响模型的前瞻性能力。该数据集源于暴力与影响早期预警系统(VIEWS),该系统通过整合多源时序数据生成国家层面的月度冲突预测。原始数据从人道主义数据交换平台(HDX)获取,经由Electric Sheep Africa团队进行标准化处理,包括统一缺失值标记、转换列名为蛇形命名法,并采用固定随机种子将数据按80:20比例划分为训练集与测试集,最终以Snappy压缩的Parquet格式存储,确保了数据的可复现性与机器学习任务的适配性。
特点
作为聚焦非洲圣多美和普林西比地区的冲突预测数据集,其核心特征体现在时空维度与预测指标的精细设计。数据集涵盖2026年至2029年的月度观测,包含12个变量,其中8个为数值型特征,4个为类别型标识。关键预测指标如main_mean_ln和main_mean提供了冲突概率的对数与原始估计值,而main_dich则呈现二分类冲突状态。所有数据均在国家层面聚合,地理编码与时间标识完整,且无缺失值,为时序预测与分类任务提供了高一致性的结构化输入。
使用方法
在机器学习应用场景中,该数据集适用于冲突预测的回归与分类建模。研究者可通过Hugging Face的datasets库直接加载数据,并转换为Pandas DataFrame进行探索性分析。训练集与测试集已预先划分,用户可基于时序特征如month_id、year构建预测模型,利用main_mean_ln等连续变量进行回归训练,或依据main_dich开展二分类任务。需注意数据来源于预警系统原始输出,建模时应参考其方法论说明,并结合地理政治背景进行结果解读。
背景与挑战
背景概述
在冲突预测与早期预警研究领域,数据驱动的模型构建对于理解与缓解区域暴力事件具有关键意义。非洲圣多美和普林西比VIEWS冲突预测数据集由Violence & Impacts Early-Warning System(VIEWS)于2026年发布,并由Electric Sheep Africa机构进行机器学习适应性处理。该数据集聚焦于国家层面的冲突风险月度预测,旨在通过量化指标提前三年预警潜在暴力冲突,为政策制定与人道主义干预提供科学依据。VIEWS系统作为获奖的预测框架,其数据生成依托于联盟的迭代研发活动,体现了计算社会科学在冲突分析中的前沿应用。
当前挑战
该数据集致力于解决冲突预测领域的核心挑战,即如何利用有限的历史数据与复杂的社会政治变量,构建高精度、可解释的长期风险模型。由于冲突事件具有稀疏性、非线性及多因素耦合特征,准确捕捉其动态演变规律面临显著困难。在数据构建过程中,原始数据依赖VIEWS系统的聚合与估算方法,可能存在定义不一致或报告偏差问题;数据集规模较小,仅包含36条国家层级观测,限制了复杂机器学习模型的训练与泛化能力。此外,自动化清洗流程难以修正原始收集中的误报值或抽样偏差,对预测结果的可靠性构成潜在制约。
常用场景
经典使用场景
在冲突预测与安全研究领域,该数据集作为VIEWS预警系统的组成部分,其经典使用场景集中于对圣多美和普林西比国家层面的暴力冲突风险进行时序建模与预测分析。研究者通常利用其提供的月度聚合数据,构建回归或分类模型,以评估未来三年内冲突爆发的概率与强度,从而为区域安全态势的量化评估提供关键数据支撑。
衍生相关工作
围绕该数据集衍生的经典工作,主要集中于机器学习方法在冲突预测中的创新应用。例如,研究者基于此类VIEWS数据开发了集成学习与时间序列模型,以提升长期预测的准确性;同时,相关成果也催生了关于预测不确定性量化、模型可解释性以及跨国家风险转移学习的一系列学术探讨,进一步拓展了计算社会科学的研究边界。
数据集最近研究
最新研究方向
在冲突预测与早期预警领域,VIEWS系统凭借其前瞻性建模能力,已成为人道主义干预与政策制定的关键工具。针对圣多美和普林西比这类小型岛国,该数据集推动了微观层面冲突驱动因素的精细化分析,将传统安全研究与机器学习方法深度融合。当前前沿探索聚焦于利用时序预测模型解析低强度冲突的演变规律,并结合区域社会经济指标,以揭示隐蔽性暴力风险的形成机制。这类研究不仅提升了预警系统的时空分辨率,也为资源有限环境下的精准防控提供了实证基础,在人道行动智能化转型中彰显出重要价值。
以上内容由遇见数据集搜集并总结生成



