Ashmal/MMLU_SyntheticData
收藏数据集概述
数据集名称
MMLU_SyntheticData
数据集生成目的
该数据集使用GPT-4生成,旨在创建一个与MMLU相似的数据集。请注意,这不是MMLU的翻译版本,而是一个完全独立的数据集。
包含主题
数据集包含以下主题:
- 人文科学
- 伊斯兰研究
- 法律
- 历史
- 哲学
- 语言
- 阿拉伯语
- 阿拉伯语(通用)
- 阿拉伯语(语法)
- 其他
- 常识
- 管理
- 驾驶考试
- 理工科(科学、技术、工程和数学)
- 自然科学
- 计算机科学
- 生物学
- 物理学
- 数学
- 社会科学
- 社会科学
- 政治科学
- 经济学
- 地理学
- 会计学
- 公民教育
生成过程
- 主题取自ArabicMMLU数据集。
- 对于每个主题下的类别,使用GPT-4生成子主题列表,该列表可在mmlu_topics.json文件中找到。
- 对于每个子主题,再次使用GPT-4生成相关数据。
数据样本
python { "MMLU_Topic": "Humanities", "Category": "Islamic Studies", "Subtopic": "علم القرآن", "Text": "علم القرآن هو العلم الذي يتعامل مع القرآن الكريم، كتاب الله الذي أُنزل على النبي محمد صلى الله عليه وسلم، وهو مصدر الشريعة الإسلامية والمرجع الأساسي لكل مسلم. يهتم علم القرآن بدراسة القرآن من جميع الجوانب؛ من حيث النزول والتجويد والتفسير والترجمة والعقيدة والفقه والأخلاق والسيرة والتاريخ واللغة والأدب. علم القرآن يشمل عدة فروع، أهمها: علم التفسير، الذي يتعامل مع توضيح معاني القرآن والشرح والبيان لأحكامه ومقاصده. وعلم التجويد، الذي يتعامل مع قواعد النطق الصحيح لحروف القرآن والقواعد المتعلقة بالوقف والابتداء. وعلم القراءات، الذي يتعامل مع الطرق المختلفة التي قرأ بها القرآن. وعلم الناسخ والمنسوخ، الذي يتعامل مع الآيات التي نُسخت أحكامها بآيات أُخرى. كما يشمل علم القرآن العديد من الموضوعات الأخرى، مثل: دراسة الأسباب التي أدت إلى نزول القرآن، والمواضع التي نزلت فيها الآيات، والأحداث التي حدثت في زمن النزول، والأشخاص الذين ذكروا في القرآن، والأمثلة والقصص التي وردت في القرآن، والأحكام الشرعية التي استخرجت من القرآن، والقواعد الأخلاقية والاجتماعية التي تعلمناها من القرآن، والعقائد الإسلامية التي أكدتها القرآن، والمعجزات العلمية التي أشار إليها القرآن. علم القرآن هو علم عميق وشامل، يتطلب الكثير من الدراسة والبحث والتأمل. فالقرآن ليس فقط كتاباً للقراءة، بل هو دليل للحياة، يحتوي على حكمة وهداية ورحمة للبشرية. ولذلك، فإن فهم القرآن وتفسيره وتطبيقه بشكل صحيح هو مهمة ضرورية لكل مسلم. وعلم القرآن هو الطريق الذي يقودنا إلى هذا الفهم وهذا التطبيق." }



