Sahaba Social Network Dataset
收藏github2025-10-17 更新2025-10-18 收录
下载链接:
https://github.com/NoorBayan/Tabaqat
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个关系型数据库,包含两个主要组成部分:1) 节点数据(sahaba_nodes.csv):包含独特圣门弟子的列表,包括姓名、部落归属等传记详细信息;2) 边缘数据(sahaba_edges.csv):包含所有有记载的互动关系,每条记录表示两个圣门弟子之间的关系,包括源节点、目标节点、关系类型(如亲属关系、圣训传述、共同参战)和原始文本引用。数据主要来源于伊本·萨阿德的《大等级》和伊本·哈杰尔的《辨别圣门弟子》等古典伊斯兰文献。
This dataset is a relational database composed of two core components: 1) Node data (sahaba_nodes.csv): a list of unique Companions of the Prophet (Sahabah), containing biographical details such as their full names and tribal affiliations; 2) Edge data (sahaba_edges.csv): a collection of all documented interactive relationships, where each entry represents a relationship between two Sahabah, including the source node, target node, relationship type (e.g., kinship, hadith transmission, joint military participation) and original textual citations. The dataset is primarily sourced from classical Islamic scholarly works including *Kitab al-Tabaqat al-Kubra* by Ibn Sa'd and *Tahdhib al-Tahdhib* by Ibn Hajar al-Asqalani.
创建时间:
2025-10-17
原始信息汇总
数据集概述
项目简介
该项目基于古典伊斯兰文献构建圣门弟子(Sahaba)社区的社交网络关系数据集,通过社会网络分析方法研究早期穆斯林社区的社会结构动态。
数据来源
- 主要来源:伊本·萨阿德的《大等级传》和伊本·哈杰尔的《圣门弟子甄别》
- 数据类型:从传记文献中系统提取的数千条记载互动关系
数据集构成
节点数据
- 文件:
sahaba_nodes.csv - 内容:圣门弟子唯一标识列表
- 属性:姓名、部落归属等传记详细信息
边数据
- 文件:
sahaba_edges.csv - 内容:记载的互动关系列表
- 属性:
- 源节点
- 目标节点
- 关系类型(亲属关系、圣训传述、共同战役参与等)
- 原始文献引用
技术特征
- 数据格式:CSV/SQLite关系型数据库
- 分析方法:社会网络分析
- 分析指标:度中心性、中介中心性、接近中心性
- 社区检测算法识别自然社交集群
应用价值
- 识别关键连接者角色
- 量化社会资本分析
- 揭示社区内部组织结构
- 分析信息传播路径
许可证
MIT许可证
项目链接
https://github.com/NoorBayan/Tabaqat
搜集汇总
数据集介绍

构建方式
在伊斯兰历史研究领域,传统人物传记往往以静态分类呈现。Sahaba社交网络数据集通过系统挖掘伊本·萨尔德《大等级传》和伊本·哈杰尔《甄别圣门弟子》等经典文献,构建了动态关系网络。该数据集采用节点-边结构进行组织,其中节点涵盖圣门弟子的姓名与部落属性,边则记录亲属关系、圣训传述和共同战役等互动类型,并标注原始文献出处,形成可量化分析的关系型数据库。
特点
该数据集呈现出多维度特征,其关系网络不仅包含基础的社交连接数据,更通过度中心性、中介中心性等指标量化历史人物的社会影响力。网络结构清晰展现出迁士与辅士等群体的自然聚类,同时揭示出连接不同社群的桥梁人物。动态可视化功能使得研究者能够直观探索信息传播路径,为理解早期穆斯林社区的组织形态提供了全新的数据视角。
使用方法
研究者可通过克隆GitHub仓库获取完整数据集与分析代码。在配置Python环境并安装依赖包后,可依次运行三个Jupyter Notebook:数据提取与清洗模块用于处理原始文本,网络分析与指标计算模块实现中心性度量和社区发现算法,可视化导出模块则生成交互式网络图谱。这种模块化设计支持学者根据研究需求灵活调整分析参数,实现定制化的历史社交网络研究。
背景与挑战
背景概述
伊斯兰传记研究领域长期依赖传统人物分类学(ilm al-rijal)对圣门弟子群体进行静态划分,难以捕捉其动态社会关联。为突破这一局限,研究团队基于伊本·萨阿德的《大等级传》和伊本·哈杰尔的《甄别圣门弟子》等古典文献,于当代构建了圣门弟子社交网络数据集。该数据集通过系统提取亲属关系、圣训传述和共同历史事件等数千组交互记录,首次将社会网络分析方法引入早期伊斯兰社群研究,为解析穆斯林共同体形成机制提供了量化研究范式。
当前挑战
在解决传统伊斯兰史学中动态社会结构分析的难题时,该数据集面临多重挑战:古典文献记载的异体命名与时空信息缺失导致节点身份消歧困难;不同类型社会关系(如血缘、知识传递、军事协作)的权重赋值需要结合历史语境进行标准化处理。数据构建过程中需克服阿拉伯古籍的非结构化文本特征,通过人工标注与规则引擎相结合的方式,从卷帙浩繁的传记资料中提取标准化关系三元组,同时确保宗教历史数据与现代网络分析框架的语义兼容性。
常用场景
经典使用场景
在伊斯兰历史研究领域,该数据集通过社会网络分析方法重构了圣门弟子社区的动态关系网络。研究者利用节点与边的关系数据,系统分析亲属关系、圣训传述和共同历史事件参与等互动模式,从而揭示早期穆斯林社群内部的信息传播路径与群体凝聚力形成机制。
实际应用
该数据集的实际应用延伸至数字人文与文化遗产保护领域。教育机构可借助其交互式可视化系统构建沉浸式历史教学工具,文化研究机构则能通过社区检测算法识别特定历史事件中的关键群体。这种数据驱动的研究方法还为伊斯兰文献的数字化整理提供了标准化范式。
衍生相关工作
基于该数据集衍生的经典研究主要集中在三个方向:其一是结合中心性指标与历史文献的交叉验证研究,如通过中介中心性分析圣训传述链的可靠性;其二是运用模块化算法解构部落亚群体的形成规律;其三是将网络动力学模型应用于早期伊斯兰社会变迁的仿真研究,这些工作共同推动了计算历史学新分支的发展。
以上内容由遇见数据集搜集并总结生成



