mendax0110/autoresearchpp

Name: mendax0110/autoresearchpp
Creator: mendax0110
Published: 2026-05-01 18:38:35
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/mendax0110/autoresearchpp

下载链接

链接失效反馈

官方服务：

资源简介：

autoresearch-cpp是一个基于C++20和LibTorch的AI研究代理系统，它通过自动修改训练源文件、构建、运行固定预算实验，并在验证集每字节位数（val_bpb）指标改善时保留更改，来自主优化神经网络架构。该系统使用从原始karpathy/autoresearch仓库复制的prepare.py脚本下载训练数据，并通过convert_for_cpp.py转换为C++可用的二进制格式（data/train.bin和data/val.bin），用于模型训练和验证。

autoresearch-cpp is a C++20/LibTorch port of karpathy/autoresearch. An AI agent modifies train source files, builds, runs a fixed-budget experiment, and keeps changes only when val_bpb improves. The system uses training data downloaded via the prepare.py script copied from the original repository, then converted to binary format (data/train.bin and data/val.bin) for C++ usage through convert_for_cpp.py.

提供机构：

mendax0110

搜集汇总

数据集介绍

构建方式

autoresearchpp 数据集的构建源于对 karpathy/autoresearch 项目的 C++20 和 LibTorch 移植。首先通过运行原仓库中的 prepare.py 脚本下载训练数据，随后利用 convert_for_cpp.py 将数据转换为 C++ 兼容的二进制格式，生成 data/train.bin 和 data/val.bin 文件。用户需通过 --data-dir 参数指向该目录，以在实验中使用。该过程将原始文本数据高效转化为适合 LibTorch 处理的紧凑格式，为后续的自主代理学习实验奠定基础。

特点

该数据集的核心特点在于其专为自主代理实验设计，支持通过 val_bpb（验证集每字节比特数）评估模型性能，该指标与词汇表大小无关，能够公平比较不同架构的改动。数据集配合 C++20 编译器和 LibTorch 框架，兼容 CPU、CUDA 和 Apple MPS 设备，并支持固定预算实验，代理可在限定时间预算内修改训练源代码、构建项目、运行实验，仅当 val_bpb 改进时才保留变更，实现高效迭代优化。

使用方法

使用该数据集时，用户需先配置 CMake 和 C++20 编译器，并根据计算资源选择 LibTorch 版本（如 CUDA 或 CPU）。完成数据准备后，通过命令行执行编译后的可执行文件，指定设备类型和预算时长，例如 ./build/autoresearchpp --device cpu --budget-secs 300。高级用户可调整序列长度、批次大小、网络深度等参数，并通过 TensorBoard 监控训练过程。自主代理模式允许 AI 代理读取 program.md 文件后自动编辑源码、运行实验并记录结果至 experiments.jsonl 文件。

背景与挑战

背景概述

autoresearchpp 数据集项目诞生于人工智能自动化研究的前沿探索中，由研究者基于 Andrej Karpathy 提出的 autoresearch 理念，以 C++20 和 LibTorch 为技术栈重新实现。该项目旨在构建一个自主智能体系统，能够自动修改训练源代码、执行固定预算下的实验，并仅保留有利于验证集 bpb 指标的变化。其核心研究问题聚焦于如何利用自动化手段加速深度学习模型的迭代与优化，减少人工干预。该数据集的影响力体现在为自动化机器学习（AutoML）领域提供了一种高效、可复现的实验框架，推动了模型搜索与超参数调优的范式革新。

当前挑战

该数据集所解决的领域问题核心在于，深度学习模型的优化常依赖于研究者大量的手工试验与直觉，过程耗时且易错。autoresearchpp 通过自主智能体修改代码、构建与运行实验，挑战了传统人工调优的低效性，但同时也面临智能体决策的可靠性问题——如何确保代码修改不引入错误且真正提升性能。在构建过程中，挑战集中于跨平台兼容性（Linux、macOS 的 CPU/CUDA/MPS 支持）、依赖管理的复杂性（LibTorch 版本与 CUDA 环境的精确匹配），以及实验评估的公平性（固定预算下验证 bpb 的稳定测量）。这些挑战要求数据集框架具备高度的鲁棒性与可移植性，以适应不同硬件与实验场景。

常用场景

经典使用场景

在神经架构搜索与自动化机器学习领域，autoresearchpp数据集主要用于驱动基于C++20与LibTorch实现的自适应学习系统。研究者通过该数据集构建一个具有自主决策能力的智能体，在固定预算约束下自动修改训练源代码、执行编译与实验评估，并依据验证集bpb指标决定模型变更的保留或回滚。这一机制使得数据集成为自动化算法设计与超参数优化的理想试验场，尤其适合探索无需人工干预的模型迭代流程，为高效开发高精度语言模型提供了可靠的实证基础。

衍生相关工作

围绕autoresearchpp衍生出一系列具有深远影响的经典工作。最典型的是继承了Karpathy原始autoresearch项目的核心思想，但将其移植至C++生态，从而充分利用LibTorch的原生性能优势。后续研究者在此基础之上拓展出多智能体协同搜索框架、增量式代码变异策略，以及面向特定硬件架构的自动编译优化方案。这些衍生工作不仅验证了基于C++的高效自动化机器学习管线的可行性，也启发了更多在嵌入式系统、边缘计算等资源受限环境下的轻量化自适应学习系统设计。

数据集最近研究