FiqhQA
收藏Hugging Face2025-08-02 更新2025-08-03 收录
下载链接:
https://huggingface.co/datasets/MBZUAI/FiqhQA
下载链接
链接失效反馈官方服务:
资源简介:
FiqhQA是一个新颖的基准数据集,专注于LLM生成的伊斯兰教法裁决,这些裁决明确地按照四大逊尼派法学派进行分类,并提供阿拉伯语和英语两种版本。
提供机构:
Mohamed Bin Zayed University of Artificial Intelligence
创建时间:
2025-07-20
原始信息汇总
FiqhQA数据集概述
基本信息
- 名称: FiqhQA
- 许可证: MIT
- 任务类别: 问答系统
- 语言: 英语(en)、阿拉伯语(ar)
- 标签: QA、Question、Islam、Ethics、Religion、LLM
- 规模类别: n<1K(小于1000条样本)
数据集详情
数据集描述
FiqhQA是一个专注于伊斯兰教法问题的问答数据集,包含四大逊尼派法学派(马立克派、哈乃斐派、沙斐仪派、罕百里派)的观点,提供阿拉伯语和英语双语版本。
数据配置
-
阿拉伯语配置:
- 特征:
- Category(类别)
- Title_original(原始标题)
- statement_original(原始声明)
- Agreement(协议)
- question_ar(阿拉伯语问题)
- maliki_ans(马立克派回答)
- hanafi_ans(哈乃斐派回答)
- shafeii_ans(沙斐仪派回答)
- hanbali_ans(罕百里派回答)
- 数据量:
- 训练集: 121个样本,380248字节
- 特征:
-
英语配置:
- 特征:
- Category(类别)
- Title_original(原始标题)
- statement_original(原始声明)
- Agreement(协议)
- title_en(英语标题)
- statement_en(英语声明)
- question_en(英语问题)
- maliki_ans(马立克派回答)
- hanafi_ans(哈乃斐派回答)
- shafeii_ans(沙斐仪派回答)
- hanbali_ans(罕百里派回答)
- 数据量:
- 训练集: 121个样本,357493字节
- 特征:
相关论文
- 标题: Sacred or Synthetic? Evaluating LLM Reliability and Abstention for Religious Questions
- 作者: Farah Atif, Nursultan Askarbekuly, Kareem Darwish, Monojit Choudhury
联系方式
- 邮箱: farah.atif@mbzuai.ac.ae
搜集汇总
数据集介绍

构建方式
在伊斯兰法学研究领域,FiqhQA数据集的构建体现了跨学派比较的学术价值。该数据集由研究团队精心策划,聚焦于四大逊尼派法学流派(马立克、哈乃斐、沙斐仪和罕百里学派)对宗教问题的裁决观点。构建过程中采用双语平行语料设计,通过专业领域知识将原始阿拉伯语内容与英语译文精准对应,确保了121个问答样本在两种语言版本中的一致性。数据采集严格遵循法学传统,每个问题均标注了不同学派的权威解答,为比较法学研究提供了结构化数据基础。
使用方法
该数据集适用于宗教法学问答系统开发、法学观点比较研究等场景。研究者可通过HuggingFace平台获取阿拉伯语或英语版本的训练数据,利用预定义的类别标签和学派答案字段进行模型训练或分析。对于法学研究,可对比四大学派对同一问题的裁决差异;对于自然语言处理任务,则可用于构建基于特定法学流派的问答系统。使用时应尊重宗教文本的特殊性,注意结合伊斯兰法学传统进行结果解释。
背景与挑战
背景概述
FiqhQA数据集由Farah Atif、Nursultan Askarbekuly、Kareem Darwish和Monojit Choudhury等研究人员共同创建,旨在评估大型语言模型(LLM)在宗教问题上的可靠性和回避倾向。该数据集专注于伊斯兰教法(Fiqh)领域,特别涵盖了四大逊尼派法学流派(马立克、哈乃斐、沙斐仪和罕百里)的裁决,并以阿拉伯语和英语双语呈现。作为宗教与人工智能交叉领域的前沿研究工具,FiqhQA为探索LLM在复杂宗教语境下的表现提供了重要基准,填补了当前宗教问答系统评估的空白。
当前挑战
FiqhQA数据集面临的核心挑战主要体现在领域问题和构建过程两方面。在领域层面,宗教文本具有高度专业性和文化敏感性,不同法学流派对同一问题可能给出差异化的裁决,这对模型的语义理解和立场判别能力提出了极高要求。构建过程中,研究人员需克服双语对齐的复杂性,确保阿拉伯语原始教法概念在英语翻译中的准确性;同时,四大法学派别的裁决收集与验证需要深厚的宗教法学知识,数据集规模受限也反映了高质量宗教标注数据的稀缺性。
常用场景
经典使用场景
在伊斯兰法学研究领域,FiqhQA数据集为学者提供了跨学派比较分析的宝贵资源。该数据集收录了四大逊尼派法学流派(马立克、哈乃斐、沙斐仪、罕百里)针对相同宗教伦理问题的差异化解答,使得研究人员能够系统性地考察不同法学传统在教义解释上的共性与分歧。其双语特性(阿拉伯语与英语)进一步打破了语言壁垒,为比较法学研究提供了标准化基准。
解决学术问题
该数据集有效解决了伊斯兰法学研究中长期存在的三个核心问题:不同学派对同一教律问题的解释差异缺乏系统化整理;阿拉伯语法学资源对非母语研究者造成的语言障碍;传统法学研究缺乏结构化数据支撑定量分析。通过提供标准化的问题-答案对,FiqhQA为法学比较研究建立了可量化的评估框架,显著提升了跨学派研究的科学性与可重复性。
实际应用
在实际应用层面,FiqhQA正推动着多项前沿技术的发展。伊斯兰金融合规系统利用该数据集训练算法,确保金融产品符合特定法学派别的教规要求;智能宗教咨询平台通过分析不同学派的解答差异,为用户提供个性化指导;数字人文研究则借助该数据集构建伊斯兰法学知识图谱,实现教律条款的智能检索与关联分析。
数据集最近研究
最新研究方向
在伊斯兰法学与人工智能交叉领域,FiqhQA数据集的推出为评估大型语言模型在宗教问答中的可靠性和中立性提供了重要基准。该数据集聚焦于四大逊尼派法学流派对同一宗教问题的差异化解释,其双语特性支持跨文化比较研究。当前前沿探索集中在三个方面:通过对比模型生成的马立克、哈乃斐、沙斐仪和罕百里学派答案,分析LLMs处理宗教敏感信息时的立场偏差;结合伊斯兰伦理学框架,开发针对宗教文本的模型可信度评估体系;探索多语言环境下法学知识表示的迁移学习机制。随着中东地区AI伦理准则的制定,此类研究对确保技术应用符合伊斯兰价值观具有现实意义。
以上内容由遇见数据集搜集并总结生成



