five

Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED)|国际冲突数据集|暴力事件数据集

收藏
arXiv2025-01-08 更新2025-01-09 收录
国际冲突
暴力事件
下载链接:
http://arxiv.org/abs/2501.03928v1
下载链接
链接失效反馈
资源简介:
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 是由乌普萨拉大学和平与冲突研究系创建的一个国际冲突事件数据集。该数据集包含了全球范围内的致命暴力事件的详细信息,涵盖了事件的时间、地点、严重程度以及涉及的冲突方。数据集通过手动提取和注释新闻文本(如Factiva)来构建,结合了结构化的事件数据和非结构化的文本数据,提供了丰富的上下文信息。该数据集主要用于预测冲突的动态变化,如冲突的升级、降级和终止,旨在为政策制定者、人道主义组织和维和行动提供有针对性的干预策略。
提供机构:
乌普萨拉大学和平与冲突研究系, 奥斯陆和平研究所
创建时间:
2025-01-08
AI搜集汇总
数据集介绍
main_image_url
构建方式
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 数据集的构建基于从全球新闻机构(如路透社、法新社等)提取的新闻文本,并通过Factiva等聚合器进行手动注释。研究人员使用系统化的词典方法搜索潜在相关的文章,随后由UCDP的专家进行手动处理和标注。该数据集涵盖了1989年至2023年的全球有组织暴力事件,重点关注致命冲突事件的时间、地点和参与者。通过这种方式,数据集不仅记录了冲突事件的具体细节,还包含了新闻文本的元数据,如文章标题和来源。
使用方法
UCDP GED 数据集的使用方法主要包括冲突事件的预测和分析。研究者可以通过结合新闻文本和结构化的事件数据,利用自然语言处理技术(如BERT等模型)来预测冲突的升级和降级动态。数据集还可用于训练机器学习模型,特别是那些专注于冲突动态预测的模型。通过将新闻文本与冲突事件数据结合,研究者能够在更细粒度的层面上预测冲突的发展趋势,并为政策制定者、人道主义组织和维和行动提供可操作的见解。
背景与挑战
背景概述
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 是由乌普萨拉大学和平与冲突研究部门创建的一个数据集,旨在记录全球范围内的暴力冲突事件。该数据集的核心研究问题是通过地理编码的事件数据,捕捉冲突的动态变化,特别是暴力冲突的升级与降级。UCDP GED 数据集自1989年开始收集,涵盖了全球范围内的冲突事件,提供了详细的时间、地点、参与者以及冲突强度的信息。该数据集对冲突研究领域产生了深远影响,尤其是在冲突预测和动态分析方面,为政策制定者、人道主义组织和维和行动提供了重要的数据支持。
当前挑战
UCDP GED 数据集在解决冲突动态预测问题时面临多重挑战。首先,冲突动态的预测需要捕捉复杂的非线性变化,传统的基于历史数据的模型难以准确预测冲突的升级与降级。其次,数据集的构建过程中,依赖于手动从新闻文本中提取冲突事件信息,这一过程耗时且容易受到新闻报道偏差的影响。此外,新闻文本的多样性和复杂性使得从中提取有用的冲突信号变得困难,尤其是在区分暴力事件与非暴力背景信息时。最后,尽管UCDP GED数据集提供了丰富的地理和时间信息,但其在捕捉冲突的微观动态和参与者互动方面仍存在局限性,这限制了其在预测冲突动态方面的应用。
常用场景
经典使用场景
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 数据集广泛应用于冲突预测和动态分析领域。该数据集通过结合新闻文本和结构化冲突事件数据,利用自然语言处理技术,能够预测冲突行为体的动态变化,如政府、民兵、分离主义运动和恐怖组织之间的冲突升级或降级。其经典使用场景包括冲突动态的实时监测、冲突趋势的预测以及冲突干预策略的制定。
解决学术问题
UCDP GED 数据集解决了传统冲突预测模型难以捕捉冲突动态变化的问题。传统模型主要依赖社会经济因素或历史冲突数据,难以准确预测冲突的爆发、升级、降级或终止。通过结合新闻文本的上下文信息和结构化事件数据的精确性,UCDP GED 数据集能够提供更细粒度的预测,帮助研究者更好地理解冲突行为体之间的互动及其对冲突动态的影响。
实际应用
UCDP GED 数据集在实际应用中为政策制定者、人道主义组织和维和行动提供了可操作的见解。通过预测冲突的升级或降级,该数据集能够帮助相关机构制定有针对性的干预策略,提前部署资源以应对潜在的暴力冲突。此外,该数据集还可用于冲突预警系统的开发,帮助识别高风险地区并采取预防措施。
数据集最近研究
最新研究方向
近年来,Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 数据集在冲突预测领域的研究方向主要集中在利用自然语言处理(NLP)技术,特别是基于文本的参与者嵌入和Transformer模型,来预测冲突的动态变化。通过结合新闻文本和结构化冲突事件数据,研究者能够更准确地捕捉冲突的升级和降级趋势。这一方法不仅超越了传统模型的预测能力,还为政策制定者、人道主义组织和维和行动提供了可操作的见解。此外,研究还探索了如何通过大规模语言模型(LLM)直接从文本中提取冲突动态信号,从而减少对人工标注数据的依赖。这一前沿研究方向不仅提升了冲突预测的时效性和准确性,还为未来的冲突预防和干预策略提供了新的工具和方法。
相关研究论文
  • 1
    From Newswire to Nexus: Using text-based actor embeddings and transformer networks to forecast conflict dynamics乌普萨拉大学和平与冲突研究系, 奥斯陆和平研究所 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

alpacaGPT4_llama8b-v120-jb-seed2-alpaca_512_ngt0.7_tp0.9

该数据集包含了用户和助手之间的对话,具有用户和助手发言的文本特征,以及一个索引级别特征。数据集分为训练集,共有52001条对话记录。

huggingface 收录

Hang Seng Index

恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。

www.hsi.com.hk 收录

中国劳动力动态调查

“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库 收录

Global Burden of Disease Study (GBD)

全球疾病负担研究(GBD)数据集提供了全球范围内疾病、伤害和风险因素的详细统计数据。该数据集包括了各种健康指标,如死亡率、发病率、伤残调整生命年(DALYs)等,涵盖了多个国家和地区。数据集还提供了不同年龄组、性别和时间段的详细分析。

ghdx.healthdata.org 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录