ARC (Abstraction and Reasoning Corpus)

Name: ARC (Abstraction and Reasoning Corpus)
Creator: 光州科学技术院, 高丽大学
Published: 2024-07-30 21:11:45
License: 暂无描述

arXiv2024-07-30 更新2024-08-02 收录

下载链接：

https://github.com/ConfeitoHS/arcle

下载链接

链接失效反馈

官方服务：

资源简介：

ARC（抽象与推理语料库）是由光州科学技术院和高丽大学共同创建的数据集，旨在评估和提升人工智能系统的抽象推理能力。该数据集包含多种复杂的网格编辑任务，涉及大量的动作空间和多样化的任务类型。数据集的创建过程基于Gymnasium环境，通过定义特定的动作和状态空间来模拟ARC挑战。ARC数据集主要应用于强化学习领域，特别是用于开发和测试能够解决复杂推理问题的AI模型。

ARC (Abstraction and Reasoning Corpus) is a dataset jointly developed by the Gwangju Institute of Science and Technology and Korea University, designed to evaluate and enhance the abstract reasoning capabilities of artificial intelligence systems. This dataset includes a variety of complex grid editing tasks, involving an extensive action space and diverse task types. The construction of the ARC dataset is based on the Gymnasium environment, where specific action and state spaces are defined to simulate the ARC challenges. The ARC dataset is primarily applied in the field of reinforcement learning, especially for developing and testing AI models capable of solving complex reasoning problems.

提供机构：

光州科学技术院, 高丽大学

创建时间：

2024-07-30

原始信息汇总

ARCLE - ARC Learning Environment

概述

ARCLE 是一个用于训练 Abstraction and Reasoning Corpus 和类似数据集的强化学习环境，基于 Farama 的 Gymnasium 构建。ARCLE 实现了多个环境，支持对 ARC 网格进行多种操作，采用面向对象的网格操作。

环境

ARCLE 包含以下环境：

RawARCEnv：仅支持涂色、调整答案网格大小和提交操作的环境。
ARCEnv：实现了 ARC 的浏览器测试接口，支持涂色、泛洪填充、复制和粘贴操作。
O2ARCv2Env：实现了 O2ARCv2 接口，是 ARCEnv 的扩展，包含移动、旋转、翻转、裁剪等操作。

版本历史

0.2.6

环境变更：
- O2ARCv2Env 可通过 O2ARCEnv 或 O2ARCEnv-v2 访问。
- 统一观测类型为 np.int8。
- 统一观测空间为 Box 或 MultiBinary 字典，以便正确展平观测。
- 移除 AbstractARCEnv 的过度约束要求，用户只需重写 create_operations。
新增动作包装器 (BBoxWrapper, PointWrapper)，将选择改为边界框选择或单点选择。
Loader 现在支持可定义的随机数生成器。
组织示例。
修复 terminated 在 max_trial 为无穷大(-1)时不发出的问题。

0.2.5

支持 Python 3.8。
环境变更：
- 将 ARCEnv 重命名为 RawARCEnv。
- 移除 MiniARCEnv，请使用 RawARCEnv 并设置 loader=MiniARCLoader()。
- 新增 ARCEnv，包含 ARC 数据集提供的测试接口的动作空间。
- 所有环境的状态完全可观测，所有与状态相关的实例变量现在都在 current_state 字典中。
- 添加 n-trial 模式，可通过 gym.make() 设置最大尝试次数，-1 表示无限尝试。
- 可自定义 Submit 操作。
修复泛洪填充、粘贴、复制操作的边界问题。

0.2.2

修复默认的全有或全无奖励在提交时才给予的问题。

0.2.1

O2ARCv2Env-v0：
- 将 ResizeGrid 动作改为 CropGrid 动作。
- 强制 FloodFill 动作仅选择一个像素。
- CopyI, CopyO, Paste 将黑色像素视为背景。
- action[selection] 可以处理整数。

0.2.0

将 ArcEnv-v0 和 MiniArcEnv-v0 重命名为 ARCEnv-v0 和 MiniARCEnv-v0。
新增 O2ARCv2Env-v0 环境。
添加 O2ARC 动作：
- 使用 selection 和 selected。
- 支持涂色、泛洪填充、移动、旋转、翻转、复制、粘贴和剪贴板功能。

0.1.1

更改图像。
修复小问题。

0.1.0

初始构建。
发布 ArcEnv-v0 和 MiniArcEnv-v0。

搜集汇总

数据集介绍

构建方式

ARC (Abstraction and Reasoning Corpus) 数据集的构建基于 Gymnasium 库，旨在通过强化学习环境 ARCLE (ARC Learning Environment) 来解决抽象推理挑战。ARCLE 的设计考虑了 ARC 基准测试的复杂性，包括巨大的动作空间、难以达到的目标和多样化的任务。数据集通过定义特定的动作和状态空间，以及提供辅助损失函数来增强代理的性能，从而有效地缓解了动作空间和目标达成的问题。

特点

ARC 数据集的特点在于其高度的抽象性和推理需求，使其成为一个在领域内具有挑战性的基准测试。数据集包含了大量的动作空间，允许诸如着色、移动、旋转或翻转像素等多种动作，这为 RL 代理开发最优策略带来了复杂性。此外，ARC 任务的难度在于成功与否取决于能否准确复制复杂的网格模式，这要求对任务规则有深刻的理解和精确的应用。

使用方法

ARC 数据集的使用方法包括创建基于 Gymnasium API 的 ARCLE 环境，并通过强化学习算法训练代理来解决 ARC 任务。用户可以通过定义操作和选择来编辑输出网格，以适应环境状态。数据集还提供了多种辅助损失函数和网络架构，以显著提高代理的性能。通过这些方法，ARC 数据集不仅用于解决具体的任务，还为测试和开发先进的强化学习策略提供了平台。

背景与挑战

背景概述

ARC (Abstraction and Reasoning Corpus) 数据集由 Gwangju Institute of Science and Technology 和 Korea University 的研究人员于 2024 年创建，旨在通过 Gymnasium 库为强化学习研究提供一个环境，以应对抽象推理挑战。该数据集的核心研究问题是如何通过强化学习解决归纳推理基准，其影响力在于为评估智能体的抽象和推理能力提供了一个严格的测试平台。ARC 数据集的引入填补了强化学习领域在抽象推理任务上的空白，推动了该领域的发展。

当前挑战

ARC 数据集面临的挑战主要包括：1) 巨大的动作空间，允许多种动作如着色、移动、旋转或翻转像素，这增加了开发最优策略的复杂性；2) 难以达到的目标，成功通过精确复制复杂网格模式来衡量，这需要对任务规则的深入理解和精确应用；3) 多样化的任务，要求广泛的泛化能力，这与专注于掌握单一游戏的基准形成鲜明对比。构建过程中遇到的挑战包括设计有效的奖励系统，以及在缺乏明确任务分布的情况下，如何使智能体能够适应和解决多种任务。

常用场景

经典使用场景

ARC数据集的经典使用场景在于评估和提升强化学习代理的抽象推理能力。通过提供一系列需要从示例中推断规则并应用于测试网格的任务，ARC数据集挑战了代理在复杂环境中的推理和决策能力。这种场景特别适用于研究如何通过强化学习方法解决需要高度抽象和推理的任务，从而推动人工智能在复杂问题解决方面的进展。

解决学术问题

ARC数据集解决了学术研究中关于人工智能抽象推理能力的评估问题。传统的基准测试往往侧重于特定技能或单一任务，而ARC通过多样化的任务设计，评估了代理在有限数据和经验下的泛化能力。这不仅推动了强化学习领域的发展，还为研究人类级别的智能提供了新的视角和方法。

衍生相关工作

ARC数据集的引入催生了大量相关研究工作，包括但不限于开发类似的基准测试（如PQA、Mini-ARC）、领域特定语言和程序合成方法（如Dreaming with ARC、A Neurodiversity-Inspired Solver）以及利用大型语言模型进行任务上下文整合的研究（如Abstract Visual Reasoning Enabled by Language、LLMs and the Abstraction and Reasoning Corpus）。这些工作不仅扩展了ARC的应用范围，还深化了对抽象推理问题的理解。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集