five

Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED)|国际冲突数据集|暴力事件数据集

收藏
arXiv2025-01-08 更新2025-01-09 收录
国际冲突
暴力事件
下载链接:
http://arxiv.org/abs/2501.03928v1
下载链接
链接失效反馈
资源简介:
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 是由乌普萨拉大学和平与冲突研究系创建的一个国际冲突事件数据集。该数据集包含了全球范围内的致命暴力事件的详细信息,涵盖了事件的时间、地点、严重程度以及涉及的冲突方。数据集通过手动提取和注释新闻文本(如Factiva)来构建,结合了结构化的事件数据和非结构化的文本数据,提供了丰富的上下文信息。该数据集主要用于预测冲突的动态变化,如冲突的升级、降级和终止,旨在为政策制定者、人道主义组织和维和行动提供有针对性的干预策略。
提供机构:
乌普萨拉大学和平与冲突研究系, 奥斯陆和平研究所
创建时间:
2025-01-08
AI搜集汇总
数据集介绍
main_image_url
构建方式
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 数据集的构建基于从全球新闻机构(如路透社、法新社等)提取的新闻文本,并通过Factiva等聚合器进行手动注释。研究人员使用系统化的词典方法搜索潜在相关的文章,随后由UCDP的专家进行手动处理和标注。该数据集涵盖了1989年至2023年的全球有组织暴力事件,重点关注致命冲突事件的时间、地点和参与者。通过这种方式,数据集不仅记录了冲突事件的具体细节,还包含了新闻文本的元数据,如文章标题和来源。
使用方法
UCDP GED 数据集的使用方法主要包括冲突事件的预测和分析。研究者可以通过结合新闻文本和结构化的事件数据,利用自然语言处理技术(如BERT等模型)来预测冲突的升级和降级动态。数据集还可用于训练机器学习模型,特别是那些专注于冲突动态预测的模型。通过将新闻文本与冲突事件数据结合,研究者能够在更细粒度的层面上预测冲突的发展趋势,并为政策制定者、人道主义组织和维和行动提供可操作的见解。
背景与挑战
背景概述
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 是由乌普萨拉大学和平与冲突研究部门创建的一个数据集,旨在记录全球范围内的暴力冲突事件。该数据集的核心研究问题是通过地理编码的事件数据,捕捉冲突的动态变化,特别是暴力冲突的升级与降级。UCDP GED 数据集自1989年开始收集,涵盖了全球范围内的冲突事件,提供了详细的时间、地点、参与者以及冲突强度的信息。该数据集对冲突研究领域产生了深远影响,尤其是在冲突预测和动态分析方面,为政策制定者、人道主义组织和维和行动提供了重要的数据支持。
当前挑战
UCDP GED 数据集在解决冲突动态预测问题时面临多重挑战。首先,冲突动态的预测需要捕捉复杂的非线性变化,传统的基于历史数据的模型难以准确预测冲突的升级与降级。其次,数据集的构建过程中,依赖于手动从新闻文本中提取冲突事件信息,这一过程耗时且容易受到新闻报道偏差的影响。此外,新闻文本的多样性和复杂性使得从中提取有用的冲突信号变得困难,尤其是在区分暴力事件与非暴力背景信息时。最后,尽管UCDP GED数据集提供了丰富的地理和时间信息,但其在捕捉冲突的微观动态和参与者互动方面仍存在局限性,这限制了其在预测冲突动态方面的应用。
常用场景
经典使用场景
Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 数据集广泛应用于冲突预测和动态分析领域。该数据集通过结合新闻文本和结构化冲突事件数据,利用自然语言处理技术,能够预测冲突行为体的动态变化,如政府、民兵、分离主义运动和恐怖组织之间的冲突升级或降级。其经典使用场景包括冲突动态的实时监测、冲突趋势的预测以及冲突干预策略的制定。
解决学术问题
UCDP GED 数据集解决了传统冲突预测模型难以捕捉冲突动态变化的问题。传统模型主要依赖社会经济因素或历史冲突数据,难以准确预测冲突的爆发、升级、降级或终止。通过结合新闻文本的上下文信息和结构化事件数据的精确性,UCDP GED 数据集能够提供更细粒度的预测,帮助研究者更好地理解冲突行为体之间的互动及其对冲突动态的影响。
实际应用
UCDP GED 数据集在实际应用中为政策制定者、人道主义组织和维和行动提供了可操作的见解。通过预测冲突的升级或降级,该数据集能够帮助相关机构制定有针对性的干预策略,提前部署资源以应对潜在的暴力冲突。此外,该数据集还可用于冲突预警系统的开发,帮助识别高风险地区并采取预防措施。
数据集最近研究
最新研究方向
近年来,Uppsala Conflict Data Program (UCDP) Georeferenced Event Data (GED) 数据集在冲突预测领域的研究方向主要集中在利用自然语言处理(NLP)技术,特别是基于文本的参与者嵌入和Transformer模型,来预测冲突的动态变化。通过结合新闻文本和结构化冲突事件数据,研究者能够更准确地捕捉冲突的升级和降级趋势。这一方法不仅超越了传统模型的预测能力,还为政策制定者、人道主义组织和维和行动提供了可操作的见解。此外,研究还探索了如何通过大规模语言模型(LLM)直接从文本中提取冲突动态信号,从而减少对人工标注数据的依赖。这一前沿研究方向不仅提升了冲突预测的时效性和准确性,还为未来的冲突预防和干预策略提供了新的工具和方法。
相关研究论文
  • 1
    From Newswire to Nexus: Using text-based actor embeddings and transformer networks to forecast conflict dynamics乌普萨拉大学和平与冲突研究系, 奥斯陆和平研究所 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)

中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程 收录