israel_hamas_conflict_data|军事冲突数据集|安全数据数据集
收藏数据集概述:israel_hamas_conflict_data
数据集内容
1. 空袭警报数据
- 文件名:
air_alarms_bombardments.csv
- 时间范围: 2021年至2024年4月
- 数据来源: 通过抓取Tseva Adom官方网站获取
- 数据详情:
- 记录了所有在以色列宣布的空袭警报,用于比较冲突前后攻击的强度。
- 包含2,382次独特的火箭攻击、无人机渗透等事件,警报共宣布16,272次。
- 数据包括不同级别的聚合信息,涵盖地区、城市、村庄和区域。
2. 平民伤亡数据
- 文件名:
civilian_casualtes.csv
- 时间范围: 2023年10月7日至2024年5月11日
- 数据来源: 通过抓取外交部官方网站获取
- 数据详情:
- 包含姓名、年龄、国籍、死亡地点(含地理坐标)等信息。
- 对于延迟得知的死亡信息,包含信息出现的日期。
- 数据已标准化,可直接使用。
3. 以色列国防军(IDF)伤亡数据
- 文件名:
idf_casualties.csv
- 时间范围: 2023年10月7日至2024年5月15日
- 数据来源: 通过抓取Swords of Iron IDF Casualties官方网站获取
- 数据详情:
- 包含姓名、年龄、军衔、死亡日期等信息。
- 使用二进制变量
is_reservist
标识是否为预备役军人。 - 数据已标准化,可直接使用。
数据集特点
- 所有数据均通过官方网站抓取,确保信息的准确性和权威性。
- 数据集提供了详细的时间、地点和人员信息,适用于深入分析冲突影响。
- 数据集标准化处理,便于直接用于研究和分析。

rag-datasets/rag-mini-bioasq
该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。
hugging_face 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
Set5
Set5数据集是一个包含5张图像的图像超分辨率测试数据集,包括'baby', 'bird', 'butterfly', 'head', 'woman',通常用于评估图像超分辨率模型的性能。
huggingface 收录
PQAref
PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。
huggingface 收录