stefanocarrera/autophagycode_D_he_train-mercury_Qwen3-4B_strategy_scm_t0.2_g8

Name: stefanocarrera/autophagycode_D_he_train-mercury_Qwen3-4B_strategy_scm_t0.2_g8
Creator: stefanocarrera
Published: 2026-04-24 23:41:01
License: 暂无描述

Hugging Face2026-04-24 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/stefanocarrera/autophagycode_D_he_train-mercury_Qwen3-4B_strategy_scm_t0.2_g8

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: task_id dtype: string - name: entry_point dtype: string - name: prompt dtype: string - name: completion dtype: string - name: top_5_progression dtype: string - name: test dtype: string splits: - name: train num_bytes: 4434439 num_examples: 164 download_size: 516000 dataset_size: 4434439 configs: - config_name: default data_files: - split: train path: data/train-* ---

提供机构：

stefanocarrera

搜集汇总

数据集介绍

构建方式

该数据集基于HuggingFace平台构建，名为autophagycode_D_he_train-mercury_Qwen3-4B_strategy_scm_t0.2_g8，专用于代码生成与推理任务。其构建过程以Qwen3-4B模型为核心，采用strategy_scm策略，在温度参数t0.2下进行采样，并生成8个候选结果（g8）。数据集共包含164条训练样本，每条样本涵盖任务标识（task_id）、函数入口点（entry_point）、提示词（prompt）、补全代码（completion）、前5步进展（top_5_progression）以及测试用例（test）等结构化字段。数据规模约为4.4MB，以parquet格式存储，便于高效加载与处理。

使用方法

使用该数据集时，用户可直接从HuggingFace加载其默认配置（config_name: default），并读取训练集（split: train）数据。建议将prompt字段作为模型输入，completion字段作为目标输出，用于监督微调；top_5_progression可用于分析或增强模型的多步推理能力。test字段提供了可执行的测试用例，便于自动评估模型生成代码的正确性。由于数据格式为标准parquet，可利用HuggingFace Datasets库或Pandas进行加载，适用于Python编程环境下的模型训练与评估流水线。

背景与挑战

背景概述

该数据集由 autophagycode 团队在2025年基于 Qwen3-4B 模型，采用强度控制掩码（strategy_scm）策略与温度系数0.2的采样方法构建，旨在提升代码生成任务中模型对复杂编程问题的推理与补全能力。数据集包含164条训练样本，每条样本涵盖任务标识、函数入口点、提示、补全文本、前五步进展记录及测试用例，聚焦于细粒度的代码补全与渐进式推理训练。作为针对小型语言模型在代码智能领域应用的前沿探索，该数据集为研究低资源场景下的代码生成与调试提供了标准化基准，对推动轻量级模型在自动化编程、教育辅助等实际场景中的部署具有显著参考价值。

当前挑战

该数据集所解决的领域问题在于，当前代码生成任务多依赖大规模模型与海量数据，而小型模型在复杂逻辑推理、多步合成及错误修正方面表现脆弱，尤其缺乏对逐步推理过程的监督信号。数据集构建过程中面临双重挑战：一是如何设计有效的掩码策略，确保模型在仅使用4B参数规模下仍能捕获长程依赖与代码结构约束；二是面对仅164条训练样本的极低资源环境，平衡数据多样性以避免过拟合，同时保证样本覆盖充足的退火轨迹与测试案例，以验证模型在有限数据下的泛化能力。

常用场景

经典使用场景

该数据集聚焦于代码生成任务，特别是在编程竞赛或算法问题求解场景中展现出独特价值。数据集包含164个训练样本，每个样本涵盖任务标识、入口函数、提示文本、目标代码完成、Top-5改进路径及测试用例等结构化信息。研究者利用这些多维度特征，可构建和评估模型在给定问题描述下的代码合成能力，尤其适合探索基于策略搜索与多步推理的代码生成技术。

解决学术问题

该数据集旨在缓解代码生成领域中模型对简单问题泛化尚可、但对复杂编程挑战缺乏系统性探索的困境。通过提供“Top-5改进路径”这一特色字段，它支持研究模型如何从初始输出逐步优化至更优解的过程，为揭示大语言模型在代码修正中的推理链条提供了数据基础。其意义在于推动从单步代码预测向多步程序修复与渐近优化的研究范式转型，提升模型处理真实世界编程难题的鲁棒性。

实际应用

实际应用中，该数据集可赋能智能编程助手的迭代开发，使系统不仅能为开发者生成起始代码，还能基于测试反馈持续推荐改进方案。在自动化代码评审、学生编程作业的智能批改与辅导、以及竞赛题目的解题策略生成等场景中，数据集所蕴含的渐进式代码优化数据能显著提升辅助工具的实用性与准确性，降低人工介入成本。

数据集最近研究