five

israel_hamas_conflict_data|军事冲突数据集|安全数据数据集

收藏
github2024-06-14 更新2024-06-15 收录
军事冲突
安全数据
下载链接:
https://github.com/ElijahSum/israel_hamas_conflict_data
下载链接
链接失效反馈
资源简介:
该数据集包含以色列与哈马斯冲突相关的详细数据,包括以色列的空袭警报、平民和军事人员伤亡情况。数据集涵盖了从2021年到2024年的空袭警报数据,以及2023年10月7日至2024年5月15日的平民和军事人员伤亡数据。

This dataset contains detailed data related to the conflict between Israel and Hamas, including Israeli air raid alerts, as well as casualties among civilians and military personnel. The dataset covers air raid alert data from 2021 to 2024, and casualty data for civilians and military personnel from October 7, 2023, to May 15, 2024.
创建时间:
2024-06-13
原始信息汇总

数据集概述:israel_hamas_conflict_data

数据集内容

1. 空袭警报数据

  • 文件名: air_alarms_bombardments.csv
  • 时间范围: 2021年至2024年4月
  • 数据来源: 通过抓取Tseva Adom官方网站获取
  • 数据详情:
    • 记录了所有在以色列宣布的空袭警报,用于比较冲突前后攻击的强度。
    • 包含2,382次独特的火箭攻击、无人机渗透等事件,警报共宣布16,272次。
    • 数据包括不同级别的聚合信息,涵盖地区、城市、村庄和区域。

2. 平民伤亡数据

  • 文件名: civilian_casualtes.csv
  • 时间范围: 2023年10月7日至2024年5月11日
  • 数据来源: 通过抓取外交部官方网站获取
  • 数据详情:
    • 包含姓名、年龄、国籍、死亡地点(含地理坐标)等信息。
    • 对于延迟得知的死亡信息,包含信息出现的日期。
    • 数据已标准化,可直接使用。

3. 以色列国防军(IDF)伤亡数据

  • 文件名: idf_casualties.csv
  • 时间范围: 2023年10月7日至2024年5月15日
  • 数据来源: 通过抓取Swords of Iron IDF Casualties官方网站获取
  • 数据详情:
    • 包含姓名、年龄、军衔、死亡日期等信息。
    • 使用二进制变量is_reservist标识是否为预备役军人。
    • 数据已标准化,可直接使用。

数据集特点

  • 所有数据均通过官方网站抓取,确保信息的准确性和权威性。
  • 数据集提供了详细的时间、地点和人员信息,适用于深入分析冲突影响。
  • 数据集标准化处理,便于直接用于研究和分析。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对以色列官方网站的网络爬虫技术,旨在全面记录自2021年5月至2024年4月期间以色列与哈马斯冲突的相关数据。具体而言,'air_alarms_bombardments.csv'文件通过抓取Tseva Adom网站的数据,详细记录了以色列境内所有空袭警报的声明,包括火箭弹和无人机的入侵事件。'civilian_casualties.csv'和'idf_casualties.csv'文件则分别从以色列外交部和以色列国防军官方网站抓取,提供了自2023年10月7日至2024年5月15日期间的平民和军事人员伤亡数据。
特点
该数据集的显著特点在于其全面性和实时性。首先,数据涵盖了从2021年5月至2024年4月的长时间跨度,提供了冲突前后攻击强度的对比。其次,数据集详细记录了每次空袭警报的具体情况,包括攻击次数和受影响的城市或地区。此外,平民和军事人员的伤亡数据包含了详细的个人信息和事件细节,为深入分析提供了丰富的数据支持。
使用方法
该数据集适用于多种研究目的,包括但不限于冲突分析、人道主义评估和政策制定。研究者可以通过分析'air_alarms_bombardments.csv'文件,评估冲突对以色列社会的影响,特别是空袭警报的频率和分布。'civilian_casualties.csv'和'idf_casualties.csv'文件则提供了详细的伤亡数据,可用于评估冲突的人道主义后果和军事策略的有效性。数据集的标准化格式使其易于导入和处理,适合各类数据分析工具的使用。
背景与挑战
背景概述
israel_hamas_conflict_data数据集聚焦于2023年10月7日爆发的以色列与哈马斯冲突,由匿名研究人员或机构创建。该数据集详细记录了自2021年至2024年4月期间以色列的空袭警报、平民伤亡及以色列国防军伤亡情况。数据主要来源于以色列官方网站,如Tseva Adom网站和外交部网站,确保了数据的真实性和可靠性。此数据集的发布,为研究冲突动态、评估攻击强度及分析人道主义影响提供了宝贵的资源,对国际关系和冲突研究领域具有重要意义。
当前挑战
该数据集在构建过程中面临多重挑战。首先,由于信息源的限制,无法创建关于巴勒斯坦方面的类似数据集,这限制了研究的全面性。其次,数据收集涉及复杂的网络爬虫技术,确保数据的准确性和实时性是一大难题。此外,数据集中缺少部分关键人口统计信息,如性别和某些族群的细分,这影响了数据的深度分析。最后,由于冲突的敏感性和政治复杂性,数据的使用和解读需谨慎,避免引发不必要的争议。
常用场景
经典使用场景
israel_hamas_conflict_data数据集的经典使用场景主要集中在冲突分析和安全预警系统评估。研究者可以利用air_alarms_bombardments.csv文件中的数据,分析自2021年以来以色列的空袭警报频率和强度变化,特别是自2023年10月7日冲突爆发后的变化趋势。通过对比冲突前后的数据,可以评估安全预警系统的有效性和响应速度,为未来冲突预防和应急管理提供科学依据。
衍生相关工作
基于israel_hamas_conflict_data数据集,衍生了一系列相关的经典工作。例如,有研究利用该数据集分析了冲突期间不同地区的空袭警报频率与平民伤亡之间的关系,提出了改进预警系统的新方法。此外,还有研究探讨了冲突对以色列国防军士气和作战效率的影响,为军事战略的制定提供了新的视角。这些衍生工作不仅丰富了冲突研究的理论框架,也为实际应用提供了有力的支持。
数据集最近研究
最新研究方向
在以色列与哈马斯冲突的背景下,该数据集聚焦于冲突期间的关键事件,特别是以色列的空袭警报和人员伤亡情况。研究者们正利用这些数据来分析冲突的动态变化,包括空袭频率、地域分布以及人员伤亡的模式。此外,数据集还为比较冲突前后的攻击强度提供了宝贵的时间序列数据,有助于揭示冲突对当地社会和经济的影响。这些研究不仅有助于理解冲突的复杂性,还为政策制定者和国际社会提供了重要的决策支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

rag-datasets/rag-mini-bioasq

该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。

hugging_face 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

Set5

Set5数据集是一个包含5张图像的图像超分辨率测试数据集,包括'baby', 'bird', 'butterfly', 'head', 'woman',通常用于评估图像超分辨率模型的性能。

huggingface 收录

PQAref

PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。

huggingface 收录