five

Asbab al-Nuzul Dataset

收藏
github2026-01-02 更新2026-01-05 收录
下载链接:
https://github.com/mostafaahmed97/asbab-al-nuzul-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Asbab al-Nuzul(أسباب النزول,"启示的场合")指的是围绕特定古兰经经文启示的历史背景和情况。理解这些场合对于正确解释古兰经经文、理解启示的历史背景以及解决明显的矛盾至关重要。该数据集基于书籍《صحيح أسباب النزول دراسة حديثية》,提供了最真实的启示场合,并附有圣训分析。数据集以纯文本、JSON和CSV格式提供,按苏拉(Surah)和阿亚(Ayah)编号组织。

Asbab al-Nuzul (أسباب النزول, "Occasions of Revelation") refers to the historical contexts and circumstances surrounding the revelation of specific Quranic verses. Understanding these occasions is critical for the accurate interpretation of Quranic verses, comprehension of the historical background of revelation, and resolution of apparent contradictions. This dataset is based on the book *Ṣaḥīḥ Aṣbāb al-Nuzul: Dirāsah Ḥadīthiyyah*, providing the most authentic accounts of revelation occasions accompanied by hadith analyses. The dataset is available in plain text, JSON, and CSV formats, and is organized by Surah and Ayah numbering.
创建时间:
2026-01-01
原始信息汇总

Asbab al-Nuzul 数据集概述

数据集简介

Asbab al-Nuzul(أسباب النزول,意为“启示的缘由”)指的是与特定《古兰经》经文降示相关的历史背景和情境。理解这些缘由对于正确解读《古兰经》经文、理解降示的历史背景以及解决表面上的矛盾至关重要。

数据来源

该数据集基于以下书籍:

  • 书名:صحيح أسباب النزول دراسة حديثية
  • 作者:إبراهيم محمد العلي (Ibrahim Muhammad al-Ali)
  • 书籍链接:https://quranpedia.net/book/25685 该书提供了经过圣训分析的最为可靠的启示缘由。

数据集结构

数据集提供三种格式:

纯文本格式 (data/plaintext/)

  • 按苏拉(章)编号(零填充至3位数字)组织。
  • 每个苏拉文件夹包含阿亚(节)编号(或范围,如 200-201-202)的子文件夹。
  • 每个阿亚文件夹包含一个或多个描述缘由的文本文件。
  • 所有文本文件均为 UTF-8 编码。

JSON 格式 (data/structured/json/)

  • 包含按苏拉划分的独立文件(如 002.json)以及完整数据集文件 (all.json)。
  • 数据结构:每个条目包含以下字段:
    • surah: 苏拉编号(整数)。
    • ayahs: 该缘由所涉及的阿亚编号数组。
    • occasions: 缘由描述文本的数组(字符串)。

CSV 格式 (data/structured/csv/)

  • 包含按苏拉划分的独立文件(如 002.csv)以及完整数据集文件 (all.csv)。
  • 数据结构:包含以下列:
    • surah: 苏拉编号。
    • ayahs: 阿亚编号或范围(例如 "89" 或 "89-90-91")。
    • occasion: 缘由描述文本。
  • 为兼容 Windows 系统上的 Excel,CSV 文件使用带 BOM 的 UTF-8 编码。

数据转换

  • 可通过 scripts/python/transform.ipynb Jupyter 笔记本处理纯文本数据并生成 JSON 和 CSV 格式。
  • 用户可修改该笔记本来创建自定义数据格式、添加额外处理或筛选,或生成特定用例的格式。
  • 运行要求:pip install -r scripts/python/requirements.txt

贡献

欢迎提出建议、报告问题、文本错误或转录错误。可通过提交 Issue、Pull Request 或直接联系作者进行贡献和更正。

搜集汇总
数据集介绍
main_image_url
构建方式
在伊斯兰教经典研究领域,Asbab al-Nuzul数据集基于伊布拉欣·穆罕默德·阿里的权威著作《صحيح أسباب النزول دراسة حديثية》构建而成,该书系统梳理了古兰经经文降示的历史背景与圣训分析。数据集的构建过程通过脚本自动化处理,将原始文本材料转化为结构化的数字格式,涵盖了古兰经各章节的启示场合描述。整个流程注重保持阿拉伯语原文的完整性,并依据经文章节和节次进行层次化组织,确保了数据来源的可靠性与学术严谨性。
特点
该数据集以多格式呈现为显著特点,包括纯文本、JSON和CSV三种结构,满足不同研究场景的需求。数据按古兰经的苏拉(章节)和阿亚(节次)进行系统分类,支持零填充的数字编码方式,便于程序化访问与检索。JSON格式提供了清晰的嵌套结构,能准确表达经文与多个启示场合的对应关系;CSV格式则采用UTF-8带BOM编码,兼顾了跨平台兼容性。这种多维度的数据组织方式,为文本挖掘、历史语境分析和比较宗教学研究提供了灵活而完整的数据基础。
使用方法
研究人员可通过直接访问纯文本文件获取原始资料,或利用结构化JSON和CSV文件进行批量数据处理。数据集附带的Python转换脚本允许用户自定义数据格式,实现过滤、扩展或集成到特定分析流程中。在使用前需安装相关依赖库,确保转换环境的稳定性。该数据集适用于自然语言处理任务、古兰经注释研究、历史语言学分析以及跨文本比较项目,使用者可根据需要选择相应格式,并依据开源协议进行学术引用与二次开发。
背景与挑战
背景概述
Asbab al-Nuzul数据集聚焦于伊斯兰经典《古兰经》的经文降示背景研究,这一领域在经注学与历史神学中具有基石地位。该数据集由研究者Ibrahim Muhammad al-Ali基于其著作《صحيح أسباب النزول دراسة حديثية》构建,旨在系统整理与验证经文降示场合的可靠记载。通过数字化手段,数据集将传统文献转化为结构化数据,为计算语言学与伊斯兰文本分析提供了关键资源,促进了经文语境理解的现代化与跨学科研究。
当前挑战
该数据集致力于解决《古兰经》经文降示背景的自动化解析与语境重建问题,其核心挑战在于经文降示场合的多元记载往往存在历史叙事差异,需通过严谨的圣训考证以甄别真伪。在构建过程中,挑战主要源自原始阿拉伯语文献的复杂结构与语义歧义,要求精确的文本分割与归一化处理;同时,数据转换需兼顾多种格式输出,并确保编码兼容性,以支持不同研究场景下的应用需求。
常用场景
经典使用场景
在伊斯兰教经学与文本分析领域,Asbab al-Nuzul数据集为学者提供了系统化的《古兰经》经文降示背景资料。该数据集最经典的使用场景在于支持经文注释学(Tafsir)研究,通过结构化呈现历史事件与特定章节的关联,帮助研究者追溯每节经文的原始语境。例如,在分析《古兰经》中关于社会立法或伦理教导的经文时,学者可依据数据集中的降示场合记载,将抽象教义还原至具体的历史情境中,从而深化对经文语义层次的理解。
衍生相关工作
围绕该数据集已衍生出多项经典研究工作,主要集中在计算伊斯兰学与数字文本分析领域。例如,学者利用其结构化数据训练自然语言处理模型,自动识别经文主题与历史事件间的关联模式;亦有研究将其与《圣训》文献库进行关联分析,构建更宏大的早期伊斯兰历史知识图谱。这些工作不仅拓展了传统经学的研究方法,还催生了如“古兰经降示时序可视化工具”等创新成果,推动了宗教文本研究的数字化转型。
数据集最近研究
最新研究方向
在伊斯兰教文本计算领域,Asbab al-Nuzul数据集正推动着前沿研究,其结构化格式为自然语言处理技术在古兰经经文背景分析中的应用提供了基础。当前热点聚焦于利用机器学习模型,如序列标注和语义相似度计算,自动化提取和验证启示场合的叙事模式,以辅助经文解释的客观性。这一进展不仅深化了历史语境的理解,还促进了跨文化宗教研究的数字化进程,具有重要的学术与技术意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作