five

soar-arc-sft-2025-07-21_01

收藏
Hugging Face2025-07-22 更新2025-07-23 收录
下载链接:
https://huggingface.co/datasets/Trelis/soar-arc-sft-2025-07-21_01
下载链接
链接失效反馈
官方服务:
资源简介:
SOAR ARC-AGI SFT数据集是一个包含40,000个经过验证的例子的数据集,这些例子专门为ARC(抽象推理语料库)任务的监督微调而设计。数据集的来源模型是Mistral-Large-Instruct-2407和Qwen2.5-72B-Instruct。每个例子都是抽象推理谜题,并伴有Python代码解决方案。数据集采用标准的聊天格式,包括系统、用户和助手的消息。数据集的质量已经过验证,确保了所有代码执行结果与记录的输出相匹配。
提供机构:
Trelis
创建时间:
2025-07-22
原始信息汇总

SOAR ARC-AGI SFT 数据集概述

数据集基本信息

  • 名称: SOAR ARC-AGI SFT Dataset
  • 用途: 专为ARC(抽象与推理语料库)任务的监督微调而设计
  • 来源: 基于SOAR数据集中的已验证示例

数据集统计信息

  • 总样本量: 40,000
    • 训练集: 36,000
    • 验证集: 4,000
  • 来源模型:
    • Mistral-Large-Instruct-2407
    • Qwen2.5-72B-Instruct

数据内容

  • 任务类型: 抽象推理谜题(附带Python代码解决方案)
  • 质量保证: 所有代码执行结果与记录结果匹配
  • 数据格式: 标准聊天格式(包含system/user/assistant消息)

数据结构

每个样本包含:

  • messages: 聊天消息列表
    • System: ARC推理的角色定义
    • User: 完整ARC任务提示(含训练示例和测试输入)
    • Assistant: 符合要求的Python代码解决方案

使用方法

python from datasets import load_dataset

dataset = load_dataset("Trelis/soar-arc-sft") print(dataset)

引用信息

  • 基础数据集: https://huggingface.co/datasets/julien31/soar_arc_train_5M
  • 生成验证: 使用ARC-AGI 2025流程生成并验证
搜集汇总
数据集介绍
main_image_url
构建方式
在抽象推理领域,该数据集通过精选SOAR数据源中经过验证的样本构建而成,采用Mistral-Large-Instruct-2407和Qwen2.5-72B-Instruct双源模型生成内容。构建过程严格遵循代码执行结果与记录输出匹配的验证机制,确保四万个样本的数据完整性,其中训练集与验证集按九比一比例划分。
使用方法
通过HuggingFace数据集库可直接加载该资源,使用load_dataset函数调用Trelis/soar-arc-sft即可获取训练与验证集。数据以标准对话消息格式组织,系统消息设定推理场景,用户消息包含完整任务描述与测试输入,助手消息则提供可直接执行的Python代码解决方案。
背景与挑战
背景概述
抽象推理作为人工智能核心研究领域,旨在模拟人类高阶认知能力。SOAR ARC-AGI SFT数据集由Trelis团队于2025年基于SOAR原始数据集构建,专门针对ARC(抽象与推理语料库)任务的监督微调场景。该数据集整合了Mistral-Large和Qwen2.5等前沿大语言模型的生成结果,通过四万条经过代码执行验证的样本,为抽象推理任务提供了高质量的训练资源,显著推进了人工智能在类比推理和模式归纳方面的研究进程。
当前挑战
ARC任务本身要求模型突破表面特征捕捉,实现深层抽象关系的推演,这对传统神经网络架构构成根本性挑战。数据集构建过程中需确保自动生成的Python代码与预期输出严格一致,涉及大规模代码执行验证的技术难题。同时需平衡生成模型的创造性输出与逻辑严谨性,避免幻觉推理,这种质量管控在数万条样本规模下尤为复杂。
常用场景
经典使用场景
在抽象推理与人工智能通用能力研究领域,SOAR ARC-AGI SFT数据集被广泛用于监督微调任务,特别是针对抽象推理谜题的代码生成与逻辑推演。研究者利用其四万条经过验证的样本,对大型语言模型进行精细化调优,以提升模型在复杂模式识别与程序合成任务中的表现。
解决学术问题
该数据集有效应对了抽象推理任务中泛化能力不足的核心挑战,为模型提供了高质量、可执行的代码解决方案范例。其意义在于弥合了符号推理与神经网络之间的鸿沟,推动了AGI系统在非结构化问题求解方面的研究进展,为衡量机器智能的抽象推理水平设立了新的基准。
实际应用
实际应用中,该数据集支撑了智能教育系统的发展,能够辅助编程逻辑教学与认知训练工具的构建。在自动化代码生成与AI辅助设计领域,它为系统提供了可解释的推理路径,增强了人工智能在创意性任务中的参与度与可靠性。
数据集最近研究
最新研究方向
在抽象推理与通用人工智能领域,SOAR ARC-AGI SFT数据集正推动基于代码生成的多模态推理研究。前沿工作聚焦于利用大语言模型如Mistral和Qwen,通过监督微调提升模型对ARC谜题的符号化理解和程序合成能力。热点方向包括结合神经符号推理与代码执行验证,以增强模型在未知任务上的泛化性能,这一进展对构建可解释的AGI系统具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作