autophagycode_D_mercury_Qwen3-0.6B_lr0.0001_c142_trust_t0.2_g6

Hugging Face2026-04-28 更新2026-04-29 收录

下载链接：

https://huggingface.co/datasets/stefanocarrera/autophagycode_D_mercury_Qwen3-0.6B_lr0.0001_c142_trust_t0.2_g6

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含142个训练样本，总大小约8MB。每个样本包含6个字符串类型的字段：task_id（任务标识）、entry_point（入口点）、prompt（提示文本）、completion（补全内容）、top_k_progression（top_k进度）和test（测试内容）。数据集仅提供训练集划分，数据文件存储路径为data/train-*，下载体积为693KB。

创建时间：

2026-04-22

原始信息汇总

根据您提供的数据集详情页面信息，以下是该数据集的概述：

数据集概述

基本信息

数据集名称：autophagycode_D_mercury_Qwen3-0.6B_lr0.0001_c142_trust_t0.2_g6
数据集地址：https://huggingface.co/datasets/stefanocarrera/autophagycode_D_mercury_Qwen3-0.6B_lr0.0001_c142_trust_t0.2_g6
数据集大小：下载大小为693,292字节，数据集总大小为8,072,080字节

数据划分

训练集（train）：包含142个样本

数据特征

该数据集包含以下字段：

task_id（字符串）：任务标识符
entry_point（字符串）：入口点
prompt（字符串）：提示文本
completion（字符串）：完成结果
top_k_progression（字符串）：Top-K 进展信息
test（字符串）：测试内容

配置信息

配置名称：default
数据文件路径：data/train-*（训练集数据文件）

搜集汇总

数据集介绍

构建方式

该数据集基于Qwen3-0.6B模型在特定超参数配置下生成，采用自噬编码（autophagycode）策略构建。具体而言，通过设定学习率为0.0001、温度系数为0.2以及生成数量参数为6，从D_mercury任务池中筛选并生成142条高质量代码完成样本。每条样本包含任务标识、入口函数、提示文本、模型补全内容、top_k渐进式生成路径及测试用例，数据以结构化格式存储，共计约8MB。

特点

数据集的核心特点在于其自噬编码机制，能够通过动态渐进式生成路径（top_k_progression）记录模型在代码补全任务中的推理过程，为分析模型决策逻辑提供细粒度视角。同时，142条样本虽小却精，聚焦于高信任度（trust参数为0.2）场景下的代码生成质量，兼顾了数据纯净性与任务多样性，适合用于代码智能领域的模型微调与行为诊断。

使用方法

数据集以HuggingFace标准格式提供单一训练集分割，用户可通过datasets库直接加载默认配置下的train分片。每条样本的prompt字段可作为输入，completion字段作为目标输出，用于监督式微调代码生成模型。此外，top_k_progression字段支持对模型推理过程的逐级分析，test字段则可用于自动化评估补全结果的正确性，适用于代码合成、算法推理及模型可解释性研究等场景。

背景与挑战

背景概述

在代码生成与程序合成领域，自动化生成可靠且正确的代码一直是人工智能研究的核心挑战。近年来，随着大语言模型在代码理解与生成任务上的突破性进展，研究者们开始聚焦于如何评估和提升模型在特定编程问题上的推理能力。该数据集由autophagycode研究团队构建，创建于2025年，基于Qwen3-0.6B模型在特定学习率与超参数配置下的训练结果，旨在探索模型在142个精心设计的编程任务上的表现。通过记录任务描述、参考解决方案以及模型在多步推理中的进展轨迹，该数据集为理解小规模语言模型在代码生成任务中的学习动态与局限性提供了宝贵资源，对推动代码智能领域的发展具有重要参考价值。

当前挑战

该数据集面临的挑战主要体现在两个方面。首先在领域问题层面，尽管代码生成任务取得了显著进展，但小规模模型（如0.6B参数级别）在复杂逻辑推理、多步骤代码构造以及边界情况处理上仍存在严重不足，模型常因上下文遗忘或错误传播导致生成代码无法通过测试用例，这揭示了当前模型在程序语义保持与结构化生成上的根本性缺陷。其次在构建过程中，数据集仅包含142个样本，规模较小且缺乏多语言、多领域分布的覆盖，可能导致训练出的模型泛化能力受限；同时，数据来源于单一模型与固定超参数组合，其性能轨迹可能无法代表更广泛的模型架构或训练策略，限制了该数据集作为基准的普适性与可比性。

常用场景

经典使用场景

该数据集名为autophagycode_D_mercury_Qwen3-0.6B_lr0.0001_c142_trust_t0.2_g6，其名称暗示了数据源自于自噬相关代码任务，并经由Qwen3-0.6B模型在特定学习率与生成参数下进行推理与筛选。数据集的训练集包含142条样本，每条样本涵盖任务标识、入口函数、提示词、代码补全、最优路径及测试用例等字段，专为代码生成与推理任务设计。在经典使用场景中，研究者通常利用该数据集训练或评估语言模型在自噬生物学领域代码合成上的能力，尤其是针对函数级别的代码补全与正确性验证，其结构化的字段设计便于开展监督学习与强化学习中的策略优化实验。

实际应用

在实际应用中，该数据集可助力开发面向生物科研人员的智能代码辅助工具，例如自动生成自噬相关基因序列分析、通路富集计算或蛋白质互作网络构建的代码片段。通过训练模型掌握给定任务提示下的准确代码补全，能够大幅减少研究人员在编写生物信息学脚本时的手动工作与语法错误。此外，该数据集还可用于构建教育型编程环境，帮助初学者在自噬研究的具体语境中学习函数实现与算法调试，从而提升生物医学领域中代码开发的效率与准确性。

衍生相关工作

围绕该数据集，衍生了一系列关于小模型在专业代码生成任务中微调与评估的经典工作。例如，研究者可能基于其top_k_progression字段展开对束搜索解码策略与温度参数影响的分析，探索低资源场景下模型的生成多样性。此外，该数据集常被用于对比不同规模语言模型（如Qwen系列与GPT系列）在生物代码补全上的迁移学习效果，也催生了结合测试用例反馈的迭代优化方法。相关工作进一步延伸至领域适配预训练、提示工程以及基于信任区域强化学习的数据筛选技术，为低参数量模型的特定领域落地提供了方法论支撑。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集