Afghanistan Kankoor Exam Questions Dataset
收藏github2025-11-23 更新2025-11-24 收录
下载链接:
https://github.com/Taikutsu-Lyrz/Afghanistan-kankoor-exam-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含阿富汗大学入学考试(Kankoor)题目的结构化JSON格式数据,涵盖化学、达里语、地质学、数学和物理等多个科目,总共包含2230个问题。数据集适用于教育研究、构建测验应用程序和人工智能学习助手等用途。
This dataset contains structured JSON-formatted data of questions from Afghanistan's university entrance examination (Kankoor), covering multiple subjects including Chemistry, Dari, Geology, Mathematics and Physics, with a total of 2230 questions. It is applicable for educational research, the development of quiz applications and AI-powered learning assistants, as well as other relevant use cases.
创建时间:
2025-11-17
原始信息汇总
阿富汗Kankoor考试数据集概述
数据集基本信息
- 数据集名称: Kankoor Exam Questions Dataset (Afghanistan)
- 作者: Salim Noor (Taikutsu Lyrz)
- 许可证: MIT
- 发布日期: 2025年
数据集内容
科目与题目数量
| 科目 | 题目数量 |
|---|---|
| 化学 | 915 |
| 达利语 | 210 |
| 地质学 | 304 |
| 数学 | 721 |
| 物理 | 80 |
| 总计 | 2230 |
包含科目
- 地质学
- 达利语
- 化学
- 物理
- 数学(积分)
数据结构
文件组织结构
dataset/ ├── data/ │ ├── geology/geology.json │ ├── dari/dari.json │ ├── chemistry/general_chemistry.json │ ├── physics/physics_mechanics_simple.json │ └── math/ │ ├── math_geometry.json │ └── math_integral.json └── schema.json
JSON数据格式
json { "id": 1, "question": "题目文本...", "options": ["选项1", "选项2", "选项3", "选项4"], "correctOption": 1, "correctAnswer": "选项1", "subject": "科目名称", "difficulty": "难度等级" }
字段说明
| 字段名称 | 类型 | 描述 |
|---|---|---|
| id | 整数 | 唯一题目标识符 |
| question | 字符串 | 题目文本 |
| options | 数组 | 选择题选项 |
| correctOption | 整数 | 正确答案的1-based索引 |
| correctAnswer | 字符串 | 正确答案文本 |
| subject | 字符串 | 科目名称 |
| difficulty | 字符串 | 难度等级(简单/中等/困难) |
用途
- 教育与研究用途
- 构建测验应用、网页应用或AI学习助手
- 为阿富汗学生提供公共参考资料
使用要求
使用本数据集时,请注明出处: "Kankoor Questions Dataset by Salim Noor (Taikutsu Lyrz) — https://github.com/Taikutsu-Lyrz/Afghanistan-kankoor-exam-dataset"
许可证信息
MIT许可证 - 允许自由使用、复制、修改和分发本数据集,需提供适当署名。
搜集汇总
数据集介绍

构建方式
阿富汗Kankoor考试题库数据集采用结构化JSON格式构建,涵盖化学、达利语、地质学、数学和物理五大学科领域。通过GitHub Actions工作流实现题目数量的自动化统计与更新,每个学科独立存储在专属目录中并遵循统一的JSON Schema验证规范。数据采集过程严格遵循阿富汗大学入学考试的知识体系框架,确保题目分类与难度分级的系统性。
特点
该数据集包含2230道标准化题目,每道题目均配备唯一标识符、题干文本、四选一选项及标准答案。题目难度分为三个梯度,支持按学科领域进行精细化检索。数据结构采用轻量级JSON格式,既保证机器可读性又便于人工审阅。所有题目均经过学科知识体系映射,能够完整反映阿富汗高等教育入学考试的核心知识点分布。
使用方法
开发者可通过加载对应学科的JSON文件直接集成到教育应用程序中,利用schema.json进行数据验证确保结构一致性。支持跨平台部署至在线学习系统或移动端应用,JavaScript示例代码展示了如何快速解析题目数据。研究人员可基于学科分类开展教育评估研究,或通过难度分级进行自适应学习路径的构建。
背景与挑战
背景概述
阿富汗坎库尔考试题库数据集由Salim Noor于2025年创建,聚焦于阿富汗高等教育入学考试的核心内容。该数据集系统收录了化学、达利语、地质学、数学及物理学五大学科的2230道标准化试题,采用结构化JSON格式存储,旨在为教育技术研究与人工智能辅助学习系统提供高质量语料。其诞生填补了中亚地区本土化教育数据资源的空白,对推动阿富汗数字化教育公平发展具有里程碑意义。
当前挑战
该数据集需应对阿富汗多语言教育体系下学科知识表示的复杂性挑战,包括达利语与普什图语等非通用语言的语义标注难题。构建过程中面临原始试题数字化转换的精确性要求,需确保2230道题目在难度分级、选项配置与标准答案映射中的逻辑一致性。同时,跨学科知识图谱的构建需解决地质学与物理学等专业领域术语的标准化问题,这对后续开发自适应学习算法提出了更高要求。
常用场景
经典使用场景
在阿富汗高等教育评估领域,该数据集为教育技术研究提供了标准化的试题资源。研究者常利用其结构化多选题数据开发智能测评系统,通过自然语言处理技术分析题目难度分布与知识点覆盖情况,构建自适应学习模型。这些模型能够模拟真实考试环境,为教育公平性研究提供数据支撑,同时助力课程体系优化与教学效果评估。
衍生相关工作
基于该数据集衍生的经典工作包括智能解题助手开发与教育数据挖掘研究。研究者构建了面向达利语题目的神经机器翻译模型,突破小语种教育技术瓶颈。在计算机辅助教育领域,出现了结合该题库的认知诊断系统,能动态评估学生知识状态。另有团队利用其物理试题训练知识图谱,开创了中亚地区学科能力预测的新方法。
数据集最近研究
最新研究方向
在高等教育资源数字化浪潮中,阿富汗坎库尔考试数据集为教育技术研究开辟了新路径。当前研究聚焦于利用自然语言处理技术构建智能题库分析系统,通过解析2230道多学科试题的语义特征与难度分布,助力个性化学习路径推荐模型的开发。该数据集的结构化格式正推动跨学科知识图谱构建,结合阿富汗本土教育需求,探索自适应测评系统在资源匮乏地区的应用潜力,为教育公平研究提供重要数据支撑。
以上内容由遇见数据集搜集并总结生成



