Qiraat Ayah Map
收藏github2026-03-27 更新2026-03-28 收录
下载链接:
https://github.com/quranpedia/qiraat-ayah-map
下载链接
链接失效反馈官方服务:
资源简介:
开放数据集,映射可兰经经文编号在十种Qiraat使用的六种规范计数系统之间。
An open dataset that maps Quranic verse numbers between the six standardized counting systems employed by the ten Qiraat.
创建时间:
2026-03-26
原始信息汇总
Qiraat Ayah Map 数据集概述
数据集背景
本数据集旨在解决《古兰经》十种标准诵读法(Qiraat)中,因六种不同的节文计数系统(adad)导致的章节编号差异问题。由于计数系统不同,同一“苏拉+节文”组合在不同诵读法中并不稳定。
核心内容
数据集提供了预计算的JSON文件,用于在哈夫斯(Kufan计数系统)与其他五种计数系统之间进行节文编号的映射。
数据结构与文件
源数据层 (data/)
counting-systems.json: 6种计数系统的手动维护注册表。qiraat.json: 10种诵读法及20位传述人的手动维护注册表。book-boundary-primitives.json: 面向学者的、按经典对齐的争议边界原语(权威编辑源)。book-boundary-evidence.json: 与上述原语文件配对的权威证据侧文件,记录验证状态、引用来源等。
生成产物层 (dist/)
- 映射文件:
mappings/by-counting-system/: 包含10个文件(5种非Kufan系统 × 2个方向),实现哈夫斯(Kufan)与其他计数系统之间的双向映射。mappings/by-rawi/: 包含24个文件(12位非Kufan传述人 × 2个方向),提供传述人级别的别名映射。
- 元数据文件:
rawis/{rawi}.json: 20位传述人的生成元数据文件。
- 统计文件:
surah-counts/{system}.json: 6种计数系统下各苏拉的节文数量及总节文数。
- 边界数据层:
differences.json: 生成的词级兼容性视图。boundary-events.json: 与生成映射对齐的权威边界事件层。differences-reconciliation.json:differences.json与boundary-events.json的比对审计报告。classical-count-attestations.json: 对有争议的计数系统所记录的主要传述总节文数判定。
- 学者审阅包 (
review/): 包含主矩阵、各系统审阅表等生成文件。
演示站点数据 (site/src/lib/data/generated/)
site-data.json: 为演示站点生成的UI合约数据。
映射类型说明
正向映射(哈夫斯 -> 目标系统)
- 已映射: 正常的 1:1 对应关系。
- 已合并: 此哈夫斯节文未作为独立的目标节文结束,而是与后续的哈夫斯节文在目标覆盖范围内合并。
- 已拆分: 一个哈夫斯节文拆分为多个目标节文。
- 拆分并合并: 少数情况下,一个哈夫斯节文先被拆分,其最后一个目标节文又与下一个哈夫斯节文共享。
反向映射(目标系统 -> 哈夫斯)
- 已映射: 一个目标节文对应一个哈夫斯节文。
- 覆盖多个: 一个目标节文覆盖多个连续的哈夫斯节文。
六种计数系统概览
| 系统 | 阿拉伯语名称 | 总节文数 | 使用该系统的诵读法 |
|---|---|---|---|
| Kufan | الكوفي | 6,236 | Asim, Hamza, Al-Kisai, Khalaf |
| Last Madinan | المدني الأخير | 6,214 | Nafi |
| Makkan | المكي | 6,219 | Ibn Kathir |
| Basran | البصري | 6,204 | Abu Amr, Yaqub |
| First Madinan | المدني الأول | 6,214 | Abu Jafar |
| Damascene | الدمشقي | 6,226 | Ibn Amir |
数据生成与验证
- 运行
npm run generate可重新生成dist/目录下的所有产物及站点数据合约。 - 运行
npm test执行本地结构和一致性测试套件。 - 运行
npm run test:api根据 Quranpedia API 检查已知的公开穆斯哈夫ID。
主要参考文献
- 主要学术参考:البيان في عدّ آي القرآن by Abu Amr al-Dani。
- 当前数据集还追踪与Quranpedia公开穆斯哈夫的实践映射兼容性。
贡献指南
学者进行修正工作时,需区分:
- 对
data/book-boundary-primitives.json进行的按经典对齐的边界修正。 - 对生成
dist/产物的脚本进行的生成器/规范化修正。 修正后需运行npm run generate和npm test。
搜集汇总
数据集介绍

构建方式
在伊斯兰经学领域,Qiraat Ayah Map数据集的构建基于对《古兰经》六种经典计数系统的深入分析。该数据集以哈夫斯(Kufan)系统为基准,通过精心设计的映射机制,将不同诵读传统中的经文节号进行对应。构建过程首先确立了以书面对齐的原始边界层为核心,该层记录了各计数系统对争议边界的认定情况。随后,通过自动化脚本生成正向与反向映射文件,确保每个哈夫斯节号都能准确对应到目标系统的节号,同时处理合并、拆分等复杂情况。数据集的生成流程严格遵循学术规范,所有映射均经过一致性检验,并与Quranpedia等权威来源进行核对,以保证数据的准确性与可靠性。
特点
该数据集的核心特点在于其系统性与完整性,涵盖了《古兰经》全部六种计数系统及二十种诵读传统。数据集提供了多层次的数据结构,包括正向与反向映射、原始边界层、证据侧文件以及系统统计信息。其中,书面对齐的原始边界层以学术视角直接呈现各系统对争议边界的认定,便于学者进行核查与修正。此外,数据集还包含自动生成的兼容性视图、边界事件文件及核对报告,确保映射数据与底层边界声明的一致性。所有数据均以JSON格式提供,结构清晰且易于程序化处理,同时支持通过演示站点进行可视化探索与交互分析。
使用方法
使用该数据集时,研究者可通过加载预生成的JSON文件快速获取映射关系。对于正向映射,可查阅`dist/mappings/by-counting-system/`目录下的文件,将哈夫斯节号转换为目标系统节号;反向映射则提供逆向查询功能。若需深入分析争议边界,可参考`data/book-boundary-primitives.json`与`data/book-boundary-evidence.json`文件,前者列出了各系统认定的边界点,后者记录了相关的证据与审核状态。数据集还提供了每系统的章节节数统计及诵读传统元数据,便于宏观比较。用户可通过运行`npm run generate`命令重新生成所有衍生文件,或使用内置测试套件验证数据一致性。演示站点则提供了直观的可视化界面,支持多维度数据探索与比较。
背景与挑战
背景概述
Qiraat Ayah Map数据集由开源社区于近年创建,旨在解决《古兰经》十种标准诵读法(Qiraat)之间经文节次编号的映射问题。该数据集由专注于伊斯兰数字人文学科的研究者或机构主导开发,核心研究问题聚焦于六种计数系统导致的节次边界差异,这些差异直接影响跨诵读传统的经文引用与对齐。该数据集的构建为《古兰经》文本计算分析、数字版本互操作及诵读传统比较研究提供了关键基础设施,推动了伊斯兰经典文本的数字化与标准化进程。
当前挑战
该数据集首要挑战在于解决《古兰经》经文节次编号的跨系统映射问题,即如何准确对齐不同计数系统下的节次边界,以支持精确的跨传统引用与文本分析。构建过程中的挑战包括:需从古典文献如《البيان في عدّ آي القرآن》中提取并验证节次边界数据,确保学术准确性;需处理复杂的节次合并、拆分及混合变化,设计无歧义的数据模型;需维护学者可审阅的原始边界主张层与生成的操作数据集之间的同步,保障数据一致性与可追溯性。
常用场景
经典使用场景
在伊斯兰经学研究中,Qiraat Ayah Map数据集为学者提供了跨六种经典计数系统的《古兰经》经文编号映射,成为处理不同诵读传统间经文边界差异的核心工具。该数据集通过预计算的JSON映射文件,支持从哈夫斯(Kufan系统)到其他五种计数系统的正向与反向转换,使得研究人员能够精确比对不同诵读版本中经文的合并、拆分或映射关系。这一经典应用场景常见于经文注释学、诵读比较研究以及数字古兰经文本对齐项目中,为跨传统文本分析奠定了数据基础。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。例如,基于映射数据开发的古兰经文本对齐算法,能够自动检测不同诵读传统间的经文边界差异;学者利用该数据集构建了跨系统经文变体数据库,用于分析诵读传统的传播脉络;此外,结合边界原始层与证据侧文件,研究人员建立了可验证的经文边界争议标注体系,推动了经文计数研究的透明化与协作化。这些工作进一步拓展了数据集在计算语言学、数字人文和伊斯兰文本批评领域的应用深度。
数据集最近研究
最新研究方向
在伊斯兰数字人文领域,Qiraat Ayah Map数据集正推动着古兰经诵读学(Qiraat)与计算语言学的深度交叉。该数据集通过精确映射六大经典计数系统间的经文节编号,为多版本古兰经文本的自动化对齐与跨系统检索提供了结构化基础。前沿研究聚焦于利用该数据构建智能化的经文比较工具,支持学者高效分析不同诵读传统中的节边界差异,并促进数字古兰经平台的互操作性。相关热点事件包括全球数字伊斯兰遗产项目的兴起,该数据集通过开源协作模式,成为连接古典诵读学权威文献与现代计算技术的关键桥梁,对保护非物质文化遗产和推动经文研究的数字化转型具有深远意义。
以上内容由遇见数据集搜集并总结生成



