ai2_arc-pt

Hugging Face2026-02-25 更新2026-02-26 收录

下载链接：

https://huggingface.co/datasets/marlosb/ai2_arc-pt

下载链接

链接失效反馈

官方服务：

资源简介：

Ai2Arc-pt 是 AI2 ARC（AI2 Reasoning Challenge）数据集的葡萄牙语翻译版本，由 AllenAI 发布。原数据集包含 7,787 个真实的小学水平科学多选题，旨在促进高级问答研究。该数据集分为 ARC-Challenge（较难的问题）和 ARC-Easy 两个子集。翻译版本保留了原始的结构、配置和字段（id、question、choices、answerKey），仅将问题和选项文本翻译为葡萄牙语，同时保持答案键和结构不变。数据集采用 CC BY-SA 4.0 许可协议。

Ai2Arc-pt is the Portuguese translation of the AI2 ARC (AI2 Reasoning Challenge) dataset, released by AllenAI. The original dataset contains 7,787 real-world multiple-choice science questions at the elementary school level, aimed at advancing advanced question answering research. This dataset is split into two subsets: ARC-Challenge (more difficult questions) and ARC-Easy. The translated version retains the original structure, configuration and fields (id, question, choices, answerKey), with only the question and option texts translated into Portuguese, while keeping the answer key and structure unchanged. The dataset is licensed under CC BY-SA 4.0.

创建时间：

2026-02-25

搜集汇总

数据集介绍

构建方式

在科学问答领域，高质量的多语言数据集对于评估和提升模型的跨语言推理能力至关重要。ai2_arc-pt数据集通过专业翻译流程构建，其源数据为艾伦人工智能研究所发布的英文原版AI2 ARC数据集，该数据集包含小学科学水平的多项选择题。构建过程中，翻译团队严格保持了原始数据集的结构与配置，将ARC-Challenge和ARC-Easy两个子集中的问题及选项文本精准转化为葡萄牙语，同时确保答案键与数据字段的完整性，从而为葡萄牙语社区提供了一个忠实可靠的基准资源。

特点

该数据集显著特点在于其严谨的科学问题设计与双语对应性。所有题目均源自真实的学校科学课程，涵盖物理、生物、地球科学等多个学科，题目设计旨在挑战模型的深度推理能力。数据集划分为挑战集与简易集，分别对应不同难度层级，便于研究者进行分层评估。作为翻译版本，它在完全保留原始逻辑结构与答案键的同时，实现了语言的本土化，使得葡萄牙语使用者能够直接利用这一高质量资源，推动本地化自然语言处理研究的发展。

使用方法

研究人员可借助该数据集对葡萄牙语问答模型进行系统评估与训练。使用前需通过Hugging Face平台加载数据集，并选择ARC-Challenge或ARC-Easy配置以对应不同难度需求。数据以标准分割提供训练集、验证集与测试集，每个样本包含唯一标识、问题文本、选项列表及正确答案键。典型应用场景包括模型在多项选择题上的准确率评测、跨语言知识迁移研究，以及结合原英文版本进行双语或多语言推理能力的对比分析，为科学问答领域的算法进步提供实证基础。

背景与挑战

背景概述

AI2 ARC数据集由艾伦人工智能研究所于2018年发布，旨在推动高级问答系统的研究。该数据集汇集了7787道真实的小学水平科学选择题，划分为挑战集和简易集，专门设计用于评估模型的知识推理与理解能力。其核心研究问题聚焦于机器是否能够像人类一样，运用已有知识进行逻辑推断，从而正确解答需要深层理解的科学问题。自问世以来，该数据集已成为衡量模型推理性能的重要基准，对自然语言处理领域产生了深远影响。

当前挑战

该数据集旨在解决开放域科学问答的挑战，其问题设计依赖于复杂的知识推理，而非简单的文本匹配，这对模型的深层理解和逻辑推断能力提出了严峻考验。在构建过程中，研究人员需从真实教育资料中筛选并验证高质量的科学问题，确保其难度层次与知识覆盖的合理性。此外，将其翻译为葡萄牙语版本时，需在保持原意准确性与语言自然流畅之间取得平衡，同时维持原有的数据结构与评估完整性，这构成了跨语言适配中的一项细致挑战。

常用场景

经典使用场景

在自然语言处理领域，多语言问答系统的评估常面临高质量基准数据的稀缺。ai2_arc-pt数据集作为AI2 ARC的葡萄牙语翻译版本，其经典使用场景在于为葡萄牙语社区提供了一个标准化的科学问答基准。该数据集包含挑战级和简易级两个子集，涵盖了小学水平的科学选择题，广泛用于测试和比较不同模型在跨语言阅读理解与推理任务上的性能，尤其在评估模型处理复杂科学概念和逻辑推理的能力方面具有重要价值。

实际应用

在实际应用层面，ai2_arc-pt数据集为开发面向葡萄牙语用户的智能教育工具和知识服务系统提供了关键支持。基于该数据集训练的模型能够赋能自适应学习平台、智能辅导系统以及科学知识问答助手，帮助学习者深化对科学概念的理解。同时，它也为企业构建葡萄牙语市场的客户服务机器人和信息检索系统提供了可靠的测试基准，提升了相关应用在真实场景中的准确性与可靠性。

衍生相关工作

围绕ai2_arc-pt数据集，已衍生出一系列重要的研究工作。这些工作主要集中在利用该数据集进行多语言预训练模型的微调与评估，例如探究多语言BERT、XLM-R等模型在葡萄牙语科学问答上的表现。此外，一些研究专注于跨语言知识迁移策略，通过对比分析英语原版与葡萄牙语版本，深入探索语言特性对推理过程的影响。这些经典工作不仅丰富了多语言问答领域的学术成果，也为后续的低资源语言处理研究提供了方法论借鉴。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集