MMLU-Philosophy-Marathi

Hugging Face2025-06-13 更新2025-06-14 收录

下载链接：

https://huggingface.co/datasets/shubhamugare/MMLU-Philosophy-Marathi

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含哲学问题的多选题数据集，包含英文和马拉地语两个版本。数据集从MMLU基准的哲学子集中获取，并使用OpenAI GPT-4进行了翻译。每个问题都有四个选项，以及对应的英文和马拉地语翻译。

创建时间：

2025-06-03

搜集汇总

数据集介绍

构建方式

在跨语言哲学教育研究领域，MMLU-Philosophy-Marathi数据集通过系统化的翻译流程构建而成。该数据集以MMLU基准测试中的哲学子集为源数据，采用OpenAI GPT-4作为翻译引擎，将原始英文题目及选项精准转化为马拉地语。数据构建过程严格保留原有多选题结构，确保每个问题包含四个选项，并通过索引标注正确答案位置，形成双语平行语料库。

特点

作为哲学领域的多语言评估资源，该数据集最显著的特点是完整的双语对照体系。每一条数据同时包含英文原文和马拉地语译文，涵盖问题题干、选项及正确答案。数据集规模精炼但结构完整，283条哲学题目覆盖认知论、伦理学等分支，其翻译质量由先进的大语言模型保障，为研究印度马拉地语地区的哲学教育提供了标准化测评工具。

使用方法

该数据集主要服务于跨语言哲学教育研究和自然语言处理任务。使用者可通过对比双语题目开展翻译质量评估，或利用其构建马拉地语哲学问答系统。在应用时需注意，虽然翻译过程采用GPT-4保障质量，但专业哲学术语的本地化表达仍需人工校验。数据集采用标准的键值对结构存储，可直接加载至Pandas等数据分析框架，answer_index字段为模型训练提供了明确的监督信号。

背景与挑战

背景概述

MMLU-Philosophy-Marathi数据集源于对多语言哲学教育资源的迫切需求，由研究团队基于著名的MMLU（Massive Multitask Language Understanding）基准测试中的哲学子集构建而成。该数据集通过OpenAI GPT-4翻译引擎将原始英文哲学问题转化为马拉地语，旨在促进印度马拉地语使用者在哲学领域的知识获取与理解。作为跨语言教育资源的创新尝试，它不仅拓展了MMLU基准的应用范围，更为低资源语言社区的哲学教育研究提供了宝贵素材。数据集的构建体现了自然语言处理技术与人文社科研究的交叉融合，对推动教育公平和语言多样性具有积极意义。

当前挑战

该数据集面临的核心挑战主要体现在领域适应性与翻译质量两个维度。哲学问题固有的抽象性和文化特异性使得机器翻译难以准确传达概念 nuance，可能造成语义失真或文化错位。在构建过程中，专业术语的跨语言对齐、选项干扰项的等效性保持、以及答案索引的一致性验证都构成技术难点。此外，作为规模有限的低资源语言数据集，其样本覆盖度和领域代表性仍需通过持续扩充来提升，而翻译API的固有偏差也可能影响最终数据的可靠性。这些挑战直接关系到数据集在哲学教育应用中的实际效用。

常用场景

经典使用场景

在跨语言哲学教育研究中，MMLU-Philosophy-Marathi数据集为探索多语言环境下哲学概念的传递与理解提供了独特资源。该数据集通过将英文哲学问题精准翻译为马拉地语，构建了双语对照的哲学知识评估框架，特别适用于比较分析不同语言群体对同一哲学命题的认知差异。教育工作者可借助该数据集设计跨文化哲学素养测评工具，考察非英语母语学习者的哲学思维模式。

实际应用

在印度马哈拉施特拉邦等马拉地语地区，该数据集可直接应用于哲学课程的本地化教学。教育机构可基于这些翻译问题开发自适应测试系统，精准评估学生的哲学理解水平。语言技术领域则将其作为哲学专业机器翻译的黄金标准，用于优化低资源语言的学术文本翻译模型。文化人类学家还可利用这些双语问题，研究不同语言群体对哲学概念的阐释差异。

衍生相关工作

该数据集催生了多个跨学科研究方向，包括基于对比学习的哲学术语翻译优化模型、低资源语言哲学知识图谱构建等。部分研究将其与Hindi-Philosophy-QA等平行语料结合，开展印度本土语言间的哲学概念映射分析。另有工作扩展其方法论框架，创建了泰米尔语、孟加拉语等南亚语言的哲学测评数据集，形成完整的区域性哲学教育评估体系。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集