arc

Name: arc
Creator: MindsAndCompany
Published: 2024-08-05 19:58:29
License: 暂无描述

Hugging Face2024-08-05 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/mncai/arc

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为'challenge'，包含以下字段：id（字符串类型）、question（字符串类型）、choices（包含text和label的序列，均为字符串类型）、answerKey（字符串类型）、prompt_for_translation（字符串类型）和prompt（字符串类型）。数据集分为训练集（972个样本）、测试集（963个样本）和验证集（290个样本）。数据集的总下载大小为1104741字节，总大小为1954195.3549030628字节。

提供机构：

MindsAndCompany

创建时间：

2024-08-05

原始信息汇总

数据集概述

数据集配置

配置名称: challenge

数据特征

id: 字符串类型
question: 字符串类型
choices: 序列类型
- text: 字符串类型
- label: 字符串类型
answerKey: 字符串类型
prompt_for_translation: 字符串类型
prompt: 字符串类型

数据分割

训练集
- 字节数: 843610.0053619304
- 样本数: 972
测试集
- 字节数: 841488.6271331058
- 样本数: 963
验证集
- 字节数: 269096.72240802675
- 样本数: 290

数据集大小

下载大小: 1104741 字节
数据集大小: 1954195.3549030628 字节

数据文件配置

配置名称: challenge
- 训练集路径: challenge/train-*
- 测试集路径: challenge/test-*
- 验证集路径: challenge/validation-*

搜集汇总

数据集介绍

构建方式

ARC（AI2 Reasoning Challenge）数据集由艾伦人工智能研究所（AI2）构建，旨在评估机器在科学问题上的推理能力。该数据集包含7,787个多项选择题，涵盖小学和初中科学课程中的广泛主题。数据来源于公开的科学考试和教科书，经过专家团队的严格筛选和标注，确保问题的质量和多样性。每个问题都附有四个选项，其中仅有一个正确答案，且问题设计注重逻辑推理而非简单的记忆。

特点

ARC数据集的特点在于其强调复杂推理能力，而非简单的知识检索。问题设计涵盖了多个科学领域，包括物理、化学、生物和地球科学等，且难度层次分明，适合不同水平的模型评估。数据集分为挑战集和简单集，挑战集包含仅通过检索无法回答的问题，而简单集则包含可以通过现有知识库解决的问题。这种分层设计使得ARC能够全面评估模型的推理能力和知识应用能力。

使用方法

ARC数据集主要用于评估和训练模型在科学问题上的推理能力。研究人员可以通过加载数据集，将其分为训练集和测试集，用于训练和验证模型的性能。数据集支持多种格式，如JSON和CSV，便于不同框架的使用。通过分析模型在挑战集和简单集上的表现，可以深入理解模型在复杂推理任务中的优势和不足，从而指导进一步的模型优化和改进。

背景与挑战

背景概述

ARC（AI2 Reasoning Challenge）数据集由艾伦人工智能研究所（AI2）于2018年推出，旨在推动机器推理能力的研究。该数据集包含大量科学问题，涵盖物理、化学、生物等多个学科领域，要求模型具备跨学科的知识整合与推理能力。ARC的创建标志着人工智能在复杂推理任务上的重要进展，其核心研究问题在于如何让机器像人类一样进行科学推理。该数据集对自然语言处理、知识图谱和推理模型的研究产生了深远影响，成为评估模型推理能力的重要基准。

当前挑战

ARC数据集面临的挑战主要体现在两个方面。首先，其科学问题的复杂性和多样性要求模型具备广泛的知识覆盖和深度的推理能力，这对现有模型的泛化能力提出了极高要求。其次，数据集的构建过程中，如何确保问题的科学准确性和难度平衡性是一大难题，研究人员需要从大量科学文献中筛选并设计问题，同时避免引入偏见或错误信息。这些挑战不仅推动了模型在推理任务上的改进，也促进了跨学科知识的整合与应用。

常用场景

经典使用场景

ARC数据集广泛应用于自然语言处理领域，特别是在问答系统和知识推理任务中。该数据集通过提供一系列复杂的科学问题和答案，挑战模型在理解和推理方面的能力。研究者们利用ARC数据集来训练和评估模型，以提升其在处理复杂问题时的表现。

解决学术问题

ARC数据集解决了自然语言处理领域中的多个关键问题，特别是在知识推理和复杂问题解答方面。通过提供高质量的科学问答对，该数据集帮助研究者开发出能够理解和推理复杂科学概念的模型，推动了问答系统和知识推理技术的发展。

衍生相关工作

基于ARC数据集，研究者们开发了多种先进的问答系统和知识推理模型。例如，一些工作利用ARC数据集训练了基于Transformer的模型，显著提升了模型在科学问答任务中的表现。此外，ARC数据集还激发了多模态学习的研究，结合文本和图像信息进行更复杂的推理任务。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集