five

arc-programs-all

收藏
Hugging Face2025-08-06 更新2025-08-08 收录
下载链接:
https://huggingface.co/datasets/Trelis/arc-programs-all
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了任务ID、代码、预测的训练输出、预测的测试输出、正确的训练输入、正确的测试输入以及模型名称等字段。数据集分为训练集部分,共有5259908个示例,总大小为37271735102字节。

This dataset includes fields such as task ID, code, predicted training outputs, predicted test outputs, correct training inputs, correct test inputs, model names, and other relevant fields. The dataset is structured as a training split, which contains a total of 5,259,908 examples with an overall size of 37,271,735,102 bytes.
提供机构:
Trelis
创建时间:
2025-08-06
搜集汇总
数据集介绍
main_image_url
构建方式
在程序合成与抽象推理领域,arc-programs-all数据集通过系统化方法构建,涵盖超过五百万个编程实例。其构建过程整合了多样化任务标识与对应代码段,并采用先进模型生成预测输出,确保训练与测试数据的全面性与一致性。每个实例均经过严格验证,标注了输入输出的正确性,为复杂推理任务提供高质量数据支撑。
特点
该数据集以其大规模和高维度特征著称,包含字符串类型的任务标识与代码,以及多层嵌套的整数列表结构输出。其独特之处在于同时提供训练与测试预测输出,并标注每个输入的正确性布尔值,增强了数据集的可靠性与可用性。模型来源的明确记录进一步提升了数据的透明度和可追溯性,适用于深度分析与模型评估。
使用方法
研究人员可通过加载标准数据分割访问训练集,利用任务标识与代码字段进行程序合成模型训练。预测输出与正确性标注可用于验证模型性能,支持输出对比与错误分析。数据集兼容常见机器学习框架,支持批量处理与流式读取,适用于自动化推理、代码生成及人工智能泛化能力研究。
背景与挑战
背景概述
抽象与推理语料库程序数据集(ARC-Problems-All)诞生于人工智能领域对复杂推理能力探索的深化阶段,由François Chollet于2019年通过Kaggle平台发起。该数据集旨在推动机器智能超越模式识别,迈向人类水平的抽象推理能力。其核心研究问题聚焦于让模型从极少数示例中归纳出通用规则,并应用于未知情境,这对促进通用人工智能的发展具有里程碑意义,深刻影响了认知计算与机器学习交叉领域的研究方向。
当前挑战
该数据集首要挑战在于解决抽象推理中的样本高效学习问题,要求模型仅凭少量输入-输出对推断出隐含规则,并泛化至新实例,这考验了算法的归纳偏置与符号推理能力。构建过程中的挑战涉及程序化生成高质量且多样化的推理任务,确保每个问题的唯一性与逻辑严密性,同时需精确验证生成代码的正确性,避免数据泄漏或评估偏差,维护数据集的科学严谨性与挑战性。
常用场景
经典使用场景
在程序合成与代码生成领域,arc-programs-all数据集为研究程序语义理解和算法推理提供了重要支撑。该数据集通过包含大量任务代码及其对应的输入输出对,典型应用于训练模型理解程序逻辑与执行路径,尤其在抽象推理任务中,模型需根据给定示例推断出通用规则并生成正确程序,这对提升机器学习系统的程序合成能力具有关键作用。
衍生相关工作
基于arc-programs-all数据集,衍生出了一系列经典研究工作,特别是在神经程序合成和机器学习推理领域。这些工作包括开发新型Transformer架构用于代码生成、改进的强化学习算法以优化程序正确性,以及结合符号推理的混合模型。这些进展不仅丰富了程序理解的理论框架,还催生了多个开源工具和基准测试,持续推动着AI在编程自动化方面的创新。
数据集最近研究
最新研究方向
在程序合成与代码生成领域,arc-programs-all数据集作为抽象推理与代码执行的桥梁,正推动神经符号融合方法的前沿探索。研究者聚焦于其多模态输出预测与程序正确性验证机制,结合大语言模型的代码生成能力,探索可解释AI在复杂逻辑推理任务中的应用。该数据集通过提供大规模程序执行轨迹,助力构建能够理解程序语义、实现泛化推理的智能系统,对自动化编程、智能教育及认知计算领域产生深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作