autophagycode_D_he_train-mercury_Qwen3-0.6B_strategy_trust_t0.2_g7

Hugging Face2026-04-28 更新2026-04-29 收录

下载链接：

https://huggingface.co/datasets/stefanocarrera/autophagycode_D_he_train-mercury_Qwen3-0.6B_strategy_trust_t0.2_g7

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含164个训练样本，总大小约为7.5MB。每个样本包含6个字段：task_id（字符串类型，表示任务标识）、entry_point（字符串类型）、prompt（字符串类型）、completion（字符串类型）、top_k_progression（字符串类型）和test（字符串类型）。数据集仅提供训练集（train）划分，未提供验证集或测试集。数据以文件形式存储，路径格式为data/train-*。

This dataset contains 164 training samples with a total size of approximately 7.5MB. Each sample includes 6 fields: task_id (string type, representing the task identifier), entry_point (string type), prompt (string type), completion (string type), top_k_progression (string type), and test (string type). The dataset only provides a training set (train) split, with no validation or test sets. The data is stored in files with the path format data/train-*.

创建时间：

2026-04-22

原始信息汇总

根据您提供的数据集详情页面README文件内容，以下是该数据集的详细信息概述：

数据集名称

autophagycode_D_he_train-mercury_Qwen3-0.6B_strategy_trust_t0.2_g7

数据集地址

https://huggingface.co/datasets/stefanocarrera/autophagycode_D_he_train-mercury_Qwen3-0.6B_strategy_trust_t0.2_g7

数据集特征

该数据集包含以下字段：

task_id：字符串类型，任务标识符
entry_point：字符串类型，入口点
prompt：字符串类型，提示文本
completion：字符串类型，完成文本
top_k_progression：字符串类型，前K个进展信息
test：字符串类型，测试相关数据

数据集划分

仅包含一个划分：train（训练集）
- 样本数量：164个
- 字节数：7,475,956字节

数据集大小

下载大小：658,828字节
总数据集大小：7,475,956字节

配置文件

配置名称：default
数据文件路径：data/train-*（训练集数据文件）

数据集描述

该数据集是一个用于代码自动吞噬任务（autophagy code）的微调数据集，基于mercury_Qwen3-0.6B模型，采用strategy_trust策略，温度参数t0.2，生成7个候选。数据集包含164个训练样本，每个样本包含任务ID、入口点、提示、完成文本、前K个进展和测试字段，适用于代码生成或补全相关的机器学习任务。

搜集汇总

数据集介绍

构建方式

该数据集名为autophagycode_D_he_train-mercury_Qwen3-0.6B_strategy_trust_t0.2_g7，源自自噬代码领域的专业数据构建流程。其构建方式基于预训练语言模型Qwen3-0.6B，采用名为mercury的策略框架，在温度参数t=0.2及生成候选数g=7的设定下，通过信任导向的筛选机制对代码数据进行精心提炼。数据集中每个样本包含唯一任务标识(task_id)、函数入口点(entry_point)、提示文本(prompt)、补全结果(completion)、前k项进展(top_k_progression)以及测试用例(test)等结构化字段，从而确保生成代码的可追踪性与可验证性。

特点

数据集的特点在于其精细的代码生成能力验证架构。全部164条训练样本均围绕自噬代码领域设计，形成了高度专业化的知识密集型集合。每条记录不仅记录了提示与补全的配对信息，还通过top_k_progression字段追踪了模型在生成过程中的渐进式候选排序，使得研究者能够深入分析模型在信任策略下的决策路径。此外，内置的测试字段为每条代码提供了可直接执行的验证依据，从而支持对生成代码功能正确性的自动化评估，构成了一个闭环的模型性能诊断工具。

使用方法

该数据集的使用方法聚焦于代码生成模型的训练与评估。用户可直接加载'default'配置下的训练分割数据，利用prompt字段作为输入文本，以completion字段作为目标输出，开展监督式微调。通过解析task_id与entry_point可快速定位特定函数任务，结合test字段可对模型生成的代码进行功能性测试，以计算通过率等量化指标。研究者还可借鉴top_k_progression字段分析模型在多步推理中的置信度演化，进而优化提示策略或调整温度参数，为自噬代码领域的智能编程提供数据支撑。

背景与挑战

背景概述

在代码生成与程序合成领域，利用大型语言模型提升自动化编程能力已成为研究热点。该数据集由某研究团队构建，旨在探索基于Qwen3-0.6B模型的代码补全与演进策略，核心聚焦于利用自噬机制（autophagy）筛选高质量代码片段。数据集的创建时间可推测为近期，依托于HuggingFace平台发布，包含164条训练样本，每条样本涵盖任务标识、入口函数、提示语句、补全结果及最优候选序列等结构化信息。该数据集针对小规模语言模型在代码生成中的信任策略（trust）与采样温度（t=0.2）的优化效果展开研究，为代码智能领域提供了验证模型鲁棒性与生成一致性的基准资源，尤其在资源受限场景下对提升低参数量模型的代码生成质量具有指导意义。

当前挑战

该数据集所解决的领域挑战在于：大型语言模型生成代码时，常面临逻辑正确性低、语法错误多及与任务描述脱节等核心问题，尤其在小参数模型（如0.6B级别）中，推理能力与语义理解的双重限制导致生成结果不稳定。构建过程中面临的主要挑战包括：其一，如何从模型自生成的多条候选结果中，通过自噬机制有效筛选出最优代码序列，避免无效或低质量补全对模型的误导；其二，针对仅有164条训练样本的小样本场景，需设计低噪声的标注策略，确保每个样本的task_id、entry_point与prompt之间的逻辑映射准确无误；其三，top_k_progression字段的构建需平衡候选多样性与补全一致性，避免模型陷入局部最优，这对采样温度（t=0.2）和分组数（g=7）的设置提出了精细化要求。

常用场景

经典使用场景

该数据集名为autophagycode_D_he_train-mercury_Qwen3-0.6B_strategy_trust_t0.2_g7，专为代码生成与自动编程领域设计，聚焦于通过大语言模型（如Qwen3-0.6B）实现可信赖的策略优化。其经典使用场景在于评估和训练模型在给定任务描述（prompt）下生成精确代码补全（completion）的能力，尤其强调基于信任策略（strategy_trust）和温度参数（t0.2）的渐进式推理。数据集中包含task_id、entry_point和top_k_progression字段，可用于多轮代码迭代优化实验，是研究代码智能体行为鲁棒性的理想基准。

衍生相关工作

该数据集衍生了若干关键工作方向，包括基于信任策略的代码生成增强框架、温度参数感知的推理路径优化算法，以及渐进式top-k选择机制在自动程序修复中的应用。受其启发，研究者进一步提出了结合置信度校准与代码结构验证的混合模型，有效降低了低质量补全在复杂任务中的比率。此外，数据集中的字段设计（如prompt与completion的配对）催生了针对轻量级大模型代码生成能力的系统性评测体系，成为后续多项目、多语言扩展研究的参照基准。

数据集最近研究