Abstraction and Reasoning Corpus (ARC)
收藏arXiv2025-01-08 更新2025-01-10 收录
下载链接:
https://github.com/Batorskq/NSA
下载链接
链接失效反馈官方服务:
资源简介:
Abstraction and Reasoning Corpus (ARC) 是一个用于评估机器学习模型视觉推理能力的基准数据集,由海因里希·海涅大学杜塞尔多夫分校和曼海姆大学的研究团队创建。该数据集包含400个任务,每个任务通常有3到4个输入/输出对,数据量相对较小。数据集通过合成生成更多训练数据来增强模型的预训练和微调过程。ARC数据集的应用领域主要集中在视觉推理和抽象推理任务,旨在解决现有机器学习模型在复杂视觉推理任务中的不足。
Abstraction and Reasoning Corpus (ARC) is a benchmark dataset designed to evaluate the visual reasoning capabilities of machine learning models. It was created by research teams from Heinrich Heine University Düsseldorf and the University of Mannheim. This dataset comprises 400 tasks, each typically containing 3 to 4 input/output pairs, with a relatively small overall scale. Additional training data is synthetically generated to enhance the pre-training and fine-tuning processes of models. The ARC dataset is mainly applied in visual and abstract reasoning tasks, aiming to address the shortcomings of current machine learning models in complex visual reasoning tasks.
提供机构:
海因里希·海涅大学杜塞尔多夫分校, 曼海姆大学
创建时间:
2025-01-08
搜集汇总
数据集介绍

构建方式
Abstraction and Reasoning Corpus (ARC) 数据集的构建基于神经符号方法,结合了Transformer模型和组合搜索技术。首先,通过Transformer模型生成潜在的转换原语,随后利用领域特定语言(DSL)进行组合搜索,以确定正确的转换和参数。为了增强模型的泛化能力,研究者通过合成数据对Transformer进行预训练,并在测试时生成任务特定的训练数据进行微调。这种构建方式不仅提升了模型的推理能力,还显著减少了搜索时间。
特点
ARC数据集的特点在于其高度抽象和多样化的任务设计,旨在评估模型的通用推理能力。数据集包含400个训练任务,每个任务通常由3到4个输入输出对组成,任务类型涵盖了视觉模式匹配和有限推理。ARC任务的复杂性使得传统的机器学习模型和组合搜索方法难以应对,而人类则能够轻松解决大部分任务。这种特性使得ARC成为评估模型抽象推理能力的理想基准。
使用方法
ARC数据集的使用方法主要包括神经符号搜索和测试时适应(TTA)。在神经符号搜索中,Transformer模型生成转换原语建议,组合搜索则基于这些建议找到正确的转换。测试时适应通过在推理阶段生成额外的任务特定训练数据,对模型进行微调,以进一步提升性能。这种方法不仅显著提高了模型的推理效率,还使其在ARC评估集上的表现超越了现有的最先进方法。
背景与挑战
背景概述
Abstraction and Reasoning Corpus (ARC) 是由 François Chollet 于2019年提出的一个用于评估机器学习和组合搜索方法在抽象推理能力上的基准数据集。ARC旨在测试模型在视觉推理任务中的表现,尤其是那些对人类来说相对简单但对现有机器学习模型和组合搜索方法极具挑战性的任务。该数据集的核心研究问题在于如何通过少量示例(few-shot learning)来推断出复杂的视觉模式转换规则。ARC的创建推动了人工智能领域在抽象推理和视觉模式识别方面的研究,成为衡量模型通用推理能力的重要工具。
当前挑战
ARC数据集面临的主要挑战在于其任务的多样性和复杂性。首先,ARC任务要求模型能够从极少的示例中推断出复杂的视觉模式转换规则,这对现有的机器学习模型和组合搜索方法提出了极高的要求。其次,构建ARC数据集的过程中,研究人员需要设计出既具有挑战性又对人类来说直观易懂的任务,这要求任务设计者在抽象推理和视觉模式识别之间找到平衡。此外,ARC任务的多样性使得传统的组合搜索方法难以有效应对,因为搜索空间的复杂性和多样性使得找到合适的转换规则变得极为困难。这些挑战促使研究人员探索新的方法,如神经符号结合的方法,以提升模型在ARC任务上的表现。
常用场景
经典使用场景
Abstraction and Reasoning Corpus (ARC) 数据集主要用于评估机器学习模型在视觉推理任务中的抽象和推理能力。其经典使用场景包括通过少量示例(few-shot learning)来测试模型是否能够从输入-输出对中推断出潜在的转换规则,并应用于新的测试输入。这种场景模拟了人类在面对新问题时,通过有限的观察快速推理出解决方案的能力。
实际应用
ARC 数据集的实际应用场景广泛,尤其是在需要高度抽象推理的领域,如自动化编程、机器人任务规划和智能教育系统。例如,在自动化编程中,模型可以通过 ARC 数据集学习如何从少量示例中推断出代码转换规则,从而生成符合需求的程序。此外,ARC 数据集还可用于开发智能教育工具,帮助学生在有限的示例下快速掌握复杂的概念和规则。
衍生相关工作
ARC 数据集衍生了许多经典的研究工作,尤其是在神经符号方法的探索上。例如,ARGA(Abstract Reasoning with Graph Abstractions)通过图抽象和组合搜索方法,尝试解决 ARC 任务中的复杂转换问题。此外,NSA(Neuro-symbolic ARC Challenge)结合了 Transformer 模型和符号搜索,显著提升了模型在 ARC 任务上的表现。这些工作不仅推动了 ARC 数据集的应用,还为其他领域的抽象推理任务提供了新的研究思路。
以上内容由遇见数据集搜集并总结生成



