five

Ashmal/MMLU_SyntheticData

收藏
Hugging Face2024-05-22 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/Ashmal/MMLU_SyntheticData
下载链接
链接失效反馈
官方服务:
资源简介:
MMLU_SyntheticData数据集是通过GPT-4生成的,旨在创建一个类似于MMLU的数据集,但并非MMLU的翻译版本。数据集涵盖了多个学科领域,包括人文学科(如伊斯兰研究、法律、历史、哲学)、语言(如阿拉伯语、阿拉伯语(通用)、阿拉伯语(语法))、其他(如常识、管理、驾驶考试)、STEM(如自然科学、计算机科学、生物学、物理学、数学)以及社会科学(如社会科学、政治学、经济学、地理学、会计学、公民教育)。生成过程包括从ArabicMMLU数据集中选取主题,使用GPT-4生成子主题,并再次使用GPT-4为每个子主题生成数据。

MMLU_SyntheticData数据集是通过GPT-4生成的,旨在创建一个类似于MMLU的数据集,但并非MMLU的翻译版本。数据集涵盖了多个学科领域,包括人文学科(如伊斯兰研究、法律、历史、哲学)、语言(如阿拉伯语、阿拉伯语(通用)、阿拉伯语(语法))、其他(如常识、管理、驾驶考试)、STEM(如自然科学、计算机科学、生物学、物理学、数学)以及社会科学(如社会科学、政治学、经济学、地理学、会计学、公民教育)。生成过程包括从ArabicMMLU数据集中选取主题,使用GPT-4生成子主题,并再次使用GPT-4为每个子主题生成数据。
提供机构:
Ashmal
原始信息汇总

数据集概述

数据集名称

MMLU_SyntheticData

数据集生成目的

该数据集使用GPT-4生成,旨在创建一个与MMLU相似的数据集。请注意,这不是MMLU的翻译版本,而是一个完全独立的数据集。

包含主题

数据集包含以下主题:

  1. 人文科学
    • 伊斯兰研究
    • 法律
    • 历史
    • 哲学
  2. 语言
    • 阿拉伯语
    • 阿拉伯语(通用)
    • 阿拉伯语(语法)
  3. 其他
    • 常识
    • 管理
    • 驾驶考试
  4. 理工科(科学、技术、工程和数学)
    • 自然科学
    • 计算机科学
    • 生物学
    • 物理学
    • 数学
  5. 社会科学
    • 社会科学
    • 政治科学
    • 经济学
    • 地理学
    • 会计学
    • 公民教育

生成过程

  1. 主题取自ArabicMMLU数据集。
  2. 对于每个主题下的类别,使用GPT-4生成子主题列表,该列表可在mmlu_topics.json文件中找到。
  3. 对于每个子主题,再次使用GPT-4生成相关数据。

数据样本

python { "MMLU_Topic": "Humanities", "Category": "Islamic Studies", "Subtopic": "علم القرآن", "Text": "علم القرآن هو العلم الذي يتعامل مع القرآن الكريم، كتاب الله الذي أُنزل على النبي محمد صلى الله عليه وسلم، وهو مصدر الشريعة الإسلامية والمرجع الأساسي لكل مسلم. يهتم علم القرآن بدراسة القرآن من جميع الجوانب؛ من حيث النزول والتجويد والتفسير والترجمة والعقيدة والفقه والأخلاق والسيرة والتاريخ واللغة والأدب. علم القرآن يشمل عدة فروع، أهمها: علم التفسير، الذي يتعامل مع توضيح معاني القرآن والشرح والبيان لأحكامه ومقاصده. وعلم التجويد، الذي يتعامل مع قواعد النطق الصحيح لحروف القرآن والقواعد المتعلقة بالوقف والابتداء. وعلم القراءات، الذي يتعامل مع الطرق المختلفة التي قرأ بها القرآن. وعلم الناسخ والمنسوخ، الذي يتعامل مع الآيات التي نُسخت أحكامها بآيات أُخرى. كما يشمل علم القرآن العديد من الموضوعات الأخرى، مثل: دراسة الأسباب التي أدت إلى نزول القرآن، والمواضع التي نزلت فيها الآيات، والأحداث التي حدثت في زمن النزول، والأشخاص الذين ذكروا في القرآن، والأمثلة والقصص التي وردت في القرآن، والأحكام الشرعية التي استخرجت من القرآن، والقواعد الأخلاقية والاجتماعية التي تعلمناها من القرآن، والعقائد الإسلامية التي أكدتها القرآن، والمعجزات العلمية التي أشار إليها القرآن. علم القرآن هو علم عميق وشامل، يتطلب الكثير من الدراسة والبحث والتأمل. فالقرآن ليس فقط كتاباً للقراءة، بل هو دليل للحياة، يحتوي على حكمة وهداية ورحمة للبشرية. ولذلك، فإن فهم القرآن وتفسيره وتطبيقه بشكل صحيح هو مهمة ضرورية لكل مسلم. وعلم القرآن هو الطريق الذي يقودنا إلى هذا الفهم وهذا التطبيق." }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作