autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7

Hugging Face2026-03-24 更新2026-03-25 收录

下载链接：

https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含与代码执行和质量评估相关的结构化数据。数据集包含164个训练样本，每个样本包含多个字段，如任务ID（task_id）、入口点（entry_point）、是否可执行（is_executable）、是否正确（is_correct）、通过和失败的测试数量（tests_passed, tests_failed）、测试运行时间（test_run_time_ms）、错误类型（error_type）等。此外，还包含一系列Halstead复杂度指标（如词汇量、长度、体积、难度、工作量）和可维护性指数（maintainability_index）。数据集适用于代码质量分析、自动化测试评估和软件工程研究等任务。

创建时间：

2026-03-23

原始信息汇总

数据集概述

数据集基本信息

数据集名称: autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7
存储库地址: https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7
数据量: 164 个示例
数据集大小: 20,296 字节
下载大小: 17,258 字节
数据分割: 仅包含一个“train”分割

数据结构与特征

数据集包含以下字段：

标识与执行信息

task_id: 任务标识符（字符串类型）
entry_point: 入口点（字符串类型）
is_executable: 是否可执行（布尔类型）
is_correct: 是否正确（布尔类型）
tests_passed: 通过的测试数量（整数类型）
tests_failed: 失败的测试数量（整数类型）
test_run_time_ms: 测试运行时间（毫秒，浮点数类型）
error_type: 错误类型（字符串类型）

代码度量指标

halstead_vocabulary: 哈尔斯特德词汇量（整数类型）
halstead_length: 哈尔斯特德长度（整数类型）
halstead_volume: 哈尔斯特德体积（浮点数类型）
halstead_difficulty: 哈尔斯特德难度（浮点数类型）
halstead_effort: 哈尔斯特德工作量（浮点数类型）
maintainability_index: 可维护性指数（浮点数类型）
n_func_defined: 定义的函数数量（整数类型）
entry_point_repeated: 入口点是否重复（布尔类型）

数据配置

配置名称: default
数据文件路径: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集