autophagycode_metrics_D_metrics_he_unsloth__Qwen3-14B-Base-unsloth-bnb-4bit_lr0.0001_gen2

Hugging Face2026-03-06 更新2026-03-07 收录

下载链接：

https://huggingface.co/datasets/stefanocarrera/autophagycode_metrics_D_metrics_he_unsloth__Qwen3-14B-Base-unsloth-bnb-4bit_lr0.0001_gen2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含与任务执行和代码质量相关的结构化信息。数据集由164个训练样本组成，总大小为16,611字节。每个样本包含多个字段，包括任务索引（task_index）、入口点（entry_point）、是否可执行（is_executable）、是否正确（is_correct）、通过和失败的测试数量（tests_passed, tests_failed）、测试运行时间（test_run_time_ms）、错误类型（error_type）以及一系列代码复杂度度量指标（如Halstead词汇量、长度、体积、难度、工作量）和可维护性指数（maintainability_index）。该数据集适用于代码质量分析、自动化测试评估和软件工程研究等场景。

This dataset contains structured information related to task execution and code quality. It comprises 164 training samples with a total size of 16,611 bytes. Each sample includes multiple fields: task_index, entry_point, is_executable, is_correct, tests_passed and tests_failed, test_run_time_ms, error_type, a series of code complexity metrics (e.g., Halstead vocabulary, length, volume, difficulty, effort) and maintainability_index. This dataset is applicable to scenarios including code quality analysis, automated test evaluation, and software engineering research.

创建时间：

2026-03-02

原始信息汇总

数据集概述

数据集基本信息

数据集名称: autophagycode_metrics_D_metrics_he_unsloth__Qwen3-14B-Base-unsloth-bnb-4bit_lr0.0001_gen2
来源地址: https://huggingface.co/datasets/stefanocarrera/autophagycode_metrics_D_metrics_he_unsloth__Qwen3-14B-Base-unsloth-bnb-4bit_lr0.0001_gen2
下载大小: 14740 字节
数据集大小: 16611 字节

数据结构

数据格式: 包含一个名为“train”的分割。
训练集样本数量: 164 个示例。
训练集数据大小: 16611 字节。

特征字段说明

数据集包含以下特征字段：

task_index: 整数类型，表示任务索引。
entry_point: 字符串类型，表示入口点。
is_executable: 布尔类型，表示是否可执行。
is_correct: 布尔类型，表示是否正确。
tests_passed: 整数类型，表示通过的测试数量。
tests_failed: 整数类型，表示失败的测试数量。
test_run_time_ms: 空值类型，表示测试运行时间（毫秒）。
error_type: 字符串类型，表示错误类型。
halstead_vocabulary: 整数类型，表示Halstead词汇量。
halstead_length: 整数类型，表示Halstead长度。
halstead_volume: 浮点数类型，表示Halstead体积。
halstead_difficulty: 浮点数类型，表示Halstead难度。
halstead_effort: 浮点数类型，表示Halstead工作量。
maintainability_index: 浮点数类型，表示可维护性指数。

配置信息

配置名称: default
数据文件路径: data/train-*

搜集汇总

数据集介绍

构建方式

在软件工程与代码质量评估领域，autophagycode_metrics_D_metrics_he_unsloth__Qwen3-14B-Base-unsloth-bnb-4bit_lr0.0001_gen2数据集的构建体现了自动化代码分析的前沿方法。该数据集通过集成任务索引、入口点及可执行性验证等结构化字段，系统性地收集了代码样本。其核心构建逻辑依赖于对代码执行结果的自动化测试，包括通过和失败的测试案例数量统计，并结合哈尔斯特德复杂度指标与可维护性指数等量化维度，从而形成一套多维度的代码质量评估体系。

特点

该数据集的特点在于其综合性的代码度量框架。它不仅涵盖了代码的功能正确性验证，如可执行状态与测试通过率，还深入整合了软件度量学中的经典哈尔斯特德指标，包括词汇量、长度、体积、难度与努力值，辅以可维护性指数，为代码的复杂度与可维护性提供了量化依据。数据集结构紧凑，包含164个训练样本，每个样本均承载了从执行验证到静态度量的丰富属性，适用于对代码质量进行多角度分析。

使用方法

在代码质量研究与机器学习模型训练中，该数据集的使用方法聚焦于其结构化特征的应用。研究者可依据任务索引与入口点字段定位特定代码任务，利用可执行性、正确性及测试结果字段评估代码功能可靠性。同时，哈尔斯特德指标与可维护性指数可作为特征输入，用于训练预测代码质量或复杂度的模型。数据集以训练分割形式提供，可直接加载至分析管道，支持代码度量、自动化测试验证及质量预测等下游任务。

背景与挑战

背景概述

在软件工程与代码质量评估领域，自动化度量代码属性是提升开发效率与维护性的关键研究方向。autophagycode_metrics_D_metrics_he_unsloth__Qwen3-14B-Base-unsloth-bnb-4bit_lr0.0001_gen2数据集应运而生，其名称暗示了与自噬代码（autophagy code）概念及大语言模型微调过程的关联，可能由研究机构或团队在近期创建，旨在探索代码执行正确性、可维护性及复杂度之间的多维关系。该数据集通过整合任务索引、执行点、可执行状态、正确性标志及Halstead复杂度指标等特征，为核心研究问题——即如何量化评估生成代码的功能可靠性与结构质量——提供了实证基础，对推动智能代码生成与软件测试自动化的发展具有潜在影响力。

当前挑战

该数据集所针对的领域问题聚焦于代码生成与质量评估，其核心挑战在于如何准确衡量生成代码的功能正确性与结构复杂性之间的平衡。具体而言，数据集中包含的可执行性、正确性测试及Halstead指标等维度，需应对代码语义理解、测试覆盖完整性以及复杂度度量标准化的难题。在构建过程中，挑战同样显著：数据采集需确保代码样本的多样性与代表性，同时整合执行测试与静态度量指标要求高效的工具链支持；此外，处理大规模生成代码的评估流程可能面临计算资源限制与误差类型分类的复杂性，这些因素共同构成了数据集构建与应用的实质性障碍。

常用场景

经典使用场景

在软件工程与代码质量评估领域，该数据集通过整合自动化测试结果与Halstead复杂度指标，为代码可执行性与正确性分析提供了结构化基准。其经典使用场景聚焦于评估大型语言模型生成的代码片段在功能实现上的可靠性，研究者可依据测试通过率与错误类型分布，量化模型输出代码的健壮性，进而优化模型在代码生成任务中的性能。

衍生相关工作

围绕该数据集衍生的经典工作主要包括基于测试通过率与Halstead指标的代码生成模型微调策略，以及结合可维护性指数的自动化代码优化算法。这些研究进一步拓展了数据集中复杂度度量与错误类型分类的应用边界，催生了多模态代码评估框架的开发，为软件工程领域的智能化转型奠定了方法论基础。

数据集最近研究