qa_africa
收藏African History QA Dataset
概述
African History QA Dataset 是一个关于非洲历史的综合多选题数据集。该数据集由 LLaMA 3.1: 8B 语言模型生成,涵盖了非洲历史的不同主题和时期。数据集适用于教育目的、问答任务和历史知识评估,也可用于训练和评估机器学习模型。
数据来源
数据集中的问题来源于一系列历史书籍,涵盖了非洲历史的广泛主题和时期。主要来源包括:
- Le Cameroun une Afrique en miniature
- Volume I - Méthodologie et préhistoire africaine
- Volume II - Afrique ancienne
- Volume III - LAfrique du VIIe au XIe siècle
- Volume IV - LAfrique du XIIe au XVIe siècle
- Volume V - LAfrique du XVIe au XVIIe siècle
- Volume VI - Le XIXe siècle jusque vers les années 1880
- Volume VII - LAfrique sous domination coloniale, 1880-1935
- Volume VIII - LAfrique depuis 1935
数据集结构
数据集包含多选题,格式为JSON对象,包含以下字段:
- question_number: 每个问题的唯一标识符。
- question_text: 问题的主文本。
- answer_choices: 可能答案的列表,每个答案由字母(如 "A", "B", "C")和对应的文本表示。
- correct_answers: 每个问题的正确答案,存储为列表以支持多个正确答案。
- explanation: 正确答案的解释,提供额外的历史背景或澄清。
示例JSON表示: json { "question_number": "e2da32fc-3ce7-499f-92a8-d99db1af1f19_1", "question_text": "Quels étaient les principaux objectifs de la colonisation?", "answer_choices": [ {"letter": "A", "text": "Isoler lennemi principal et profiter de..."}, {"letter": "B", "text": "Soumettre les populations locales..."}, {"letter": "C", "text": "Établir des alliances stratégiques..."} ], "correct_answers": ["A"], "explanation": "Lobjectif principal de la colonisation était datteindre..." }
数据生成过程
- 内容提取: 从提供的书籍中提取内容。
- 问题生成: 使用 LLaMA 3.1: 8B 模型从提取的内容中自动生成相关问题。
- 格式化和结构化: 将问题格式化为JSON对象,并添加
answer_choices,correct_answers, 和explanation字段。
使用
该数据集适用于多种任务,包括:
- 问答任务: 用于训练和评估历史问答任务的模型。
- 教育用途: 教师和学生可将其用作非洲历史的学习工具。
- 历史分析: 研究人员和历史学家可用于分析非洲历史中常见的问题主题。
- 机器学习: 数据集与Hugging Face库兼容,便于快速集成用于模型训练。
许可证
该数据集仅用于非商业用途和教育目的。请尊重原始作者和出版商的知识产权。




