five

ARC-AGI-2 Abstraction Dataset

收藏
github2025-10-12 更新2025-10-13 收录
下载链接:
https://github.com/cristianoc/arc-agi-2-abstraction-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
一个包含120个生成的ARC-AGI-2任务求解器的数据集,附带相应的抽象实现和分析报告。该数据集包含所有120个ARC-AGI-2评估任务的求解器,采用结合编码代理与抽象细化技术的自动化方法生成。大多数求解器(116/120)通过插值测试,并包含完整的抽象分析。

A dataset containing 120 generated ARC-AGI-2 task solvers, with accompanying abstract implementations and analysis reports. This dataset includes solvers for all 120 ARC-AGI-2 evaluation tasks, which were generated using an automated approach that combines coding agents and abstraction refinement techniques. The majority of the solvers (116/120) passed interpolation tests and feature complete abstract analysis.
创建时间:
2025-10-02
原始信息汇总

ARC-AGI-2 Abstraction Dataset 数据集概述

数据集基本信息

  • 数据集名称: ARC-AGI-2 Abstraction Dataset
  • 数据规模: 包含120个生成的ARC-AGI-2任务求解器
  • 主要内容: 任务求解器及其对应的抽象实现和分析报告

数据集构成

目录结构

arc-agi-2-solutions-dataset/ ├── solutions/ # 任务求解实现 ├── abstractions/ # 抽象实现和报告 └── README.md # 说明文件

任务求解器

  • 位于solutions/目录
  • 包含Python函数,尝试解决ARC-AGI-2任务
  • 包含错误处理和边缘情况管理
  • 116/120个求解器通过插值(正确解决所有训练示例)

抽象文件

抽象代码(*_abstractions.py

  • 可重用的抽象函数和流水线
  • 常见模式:组件检测、对称性分析、形态学操作
  • 模块化设计,便于组合和重用

分析报告(*_abstractions_report.md

  • 尝试的抽象方法总结
  • 性能指标和失败分析
  • 问题解决过程的见解

关键抽象模式

  1. 组件分析: 4连通组件检测和分析
  2. 对称性检测: 轴对齐和旋转对称性识别
  3. 形态学操作: 膨胀、腐蚀和闭操作
  4. 几何推理: 边界框分析和空间关系
  5. 颜色分析: 主要颜色检测和基于颜色的分割
  6. 局部规则: 基于邻域的模式匹配和转换

使用方法

运行任务求解器

python from solutions.task1ae2feb7 import solve_1ae2feb7 input_grid = [[0, 1, 0], [1, 1, 1], [0, 1, 0]] result = solve_1ae2feb7(input_grid)

使用抽象函数

python from abstractions.task1ae2feb7_abstractions import repeat_last_nonzero_block result = repeat_last_nonzero_block(grid)

检查存储库一致性

bash python check_consistency.py python check_consistency.py --verbose

生成方法

  1. 初始分析: 检查任务结构和模式
  2. 抽象设计: 创建可重用的抽象函数
  3. 迭代优化: 基于失败测试和优化抽象
  4. 评估: 针对验证案例测试解决方案

引用信息

bibtex @dataset{arc_agi_2_abstraction_2025, title={ARC-AGI-2 Abstraction Dataset}, description={Generated solutions and abstractions for ARC-AGI-2 tasks}, year={2025}, url={https://github.com/cristianoc/arc-agi-2-abstraction-dataset} }

许可证

  • MIT许可证

贡献指南

  • 欢迎添加新任务和抽象
  • 需遵循存储库结构和命名约定
  • 需运行一致性检查
  • 需遵循代码质量指南
搜集汇总
数据集介绍
main_image_url
构建方式
在抽象推理与通用人工智能研究领域,ARC-AGI-2抽象数据集的构建采用了自动化程序合成与抽象精炼相结合的技术路径。该数据集通过编码代理与抽象函数迭代优化的方法,生成了120项评估任务的求解程序。构建过程始于基础恒等函数,随后通过分析任务结构与模式特征,设计可复用的抽象函数模块,并基于训练样例的插值性能进行多轮测试与优化。对于少数未能找到稳定插值解的任务,数据集保留了恒等函数作为基准参考,确保了内容的完整性与可扩展性。
使用方法
研究者可通过导入特定任务的求解函数直接应用于输入网格数据的处理,亦可调用抽象模块中的通用函数构建新的推理管道。数据集配套的一致性检查脚本能够验证文件结构的完整性,确保解决方案与抽象实现的对应关系。使用过程中需注意,当前求解器虽能通过训练样例的插值验证,但其对未见测试案例的泛化能力仍属开放性问题,建议结合具体研究目标进行适应性调整与扩展验证。
背景与挑战
背景概述
ARC-AGI-2抽象数据集于2025年由人工智能研究社区开发,旨在应对抽象推理核心问题,该数据集包含120项任务的自动化求解器与抽象实现。通过结合编码代理与抽象精炼技术,数据集推动了程序合成领域的发展,其模块化设计为复杂模式识别与几何推理研究提供了重要基础,显著提升了人工智能系统在非结构化问题中的泛化能力。
当前挑战
该数据集首要挑战在于解决抽象推理任务的泛化难题,即训练后的模型需适应未见测试案例的复杂模式。构建过程中面临自动化生成稳定求解器的技术瓶颈,部分任务因无法找到插值程序而依赖基础函数作为替代方案,同时抽象函数的可复用性与跨任务组合效率仍需进一步优化以应对多样化的推理场景。
常用场景
经典使用场景
在通用人工智能的核心推理能力研究中,ARC-AGI-2抽象数据集通过120项任务求解器的结构化实现,为程序合成与抽象推理提供了标准化实验平台。该数据集典型应用于构建可解释的认知架构验证,研究者通过分析组件检测、对称性识别等六类抽象模式,系统评估智能体从具体实例到泛化规则的推导能力。其插值验证机制确保了116个求解器在训练样本上的精确拟合,为抽象推理的可靠性研究奠定了实证基础。
解决学术问题
该数据集有效应对了符号推理与神经网络融合中的语义鸿沟问题,通过模块化抽象函数库将低维像素空间映射为高阶符号表示。在程序归纳领域,它解决了样本效率低下与泛化能力不足的经典难题,其形态学操作与几何关系分析为跨任务知识迁移提供了技术范式。这种结构化抽象方法显著提升了智能体对未知测试案例的适应能力,推动了机器推理从记忆模仿向概念理解的范式转变。
实际应用
在工业自动化领域,该数据集的抽象检测技术已应用于视觉质量检测系统,通过组件分析与局部规则匹配实现缺陷识别。教育科技领域则借助其对称性检测模块开发智能解题助手,辅助学生理解几何变换的底层逻辑。医疗影像分析中借鉴其颜色分割算法,实现了细胞结构的自动化分类。这些应用验证了抽象推理技术在复杂场景下的鲁棒性,为行业智能化转型提供了可复用的技术组件。
数据集最近研究
最新研究方向
在通用人工智能评测领域,ARC-AGI-2抽象数据集正推动程序合成与认知抽象机制的前沿探索。研究者通过自动化代码生成与抽象精炼技术,构建了涵盖120项评测任务的解决方案库,其中116个解决方案已实现训练样本的精确拟合。该数据集的核心价值在于其系统化抽象模式库,包含组件分析、对称性检测、形态学运算等六类可复用的认知算子,为机器推理的模块化设计提供了实证基础。当前研究热点聚焦于跨任务泛化能力的突破,通过分析未成功案例的失败模式,揭示抽象边界对复杂推理任务的制约机制。这一工作不仅深化了对机器抽象思维形成过程的理解,更为构建具备人类级推理能力的通用人工智能系统奠定了关键数据基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作