five

autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g10

收藏
Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g10
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含164个训练样本,总大小18,976字节。每个样本包含14个特征字段,主要涉及编程代码分析相关指标:1) 基础标识符(task_id, entry_point);2) 执行状态(is_executable, is_correct);3) 测试结果(tests_passed, tests_failed, test_run_time_ms, error_type);4) 代码复杂度指标(halstead_vocabulary/length/volume/difficulty/effort);5) 可维护性指数(maintainability_index)。数据集适用于代码质量评估、程序正确性验证、软件工程研究等任务,特别适合需要结合静态代码特征和动态执行结果的研究场景。
创建时间:
2026-03-23
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g10
  • 存储地址: https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g10
  • 数据量: 164 个示例
  • 数据集大小: 20309 字节
  • 下载大小: 17187 字节

数据结构与特征

数据集包含以下特征字段:

  • task_id: 字符串类型,任务标识符。
  • entry_point: 字符串类型,入口点。
  • is_executable: 布尔类型,是否可执行。
  • is_correct: 布尔类型,是否正确。
  • tests_passed: 整型,通过的测试数量。
  • tests_failed: 整型,失败的测试数量。
  • test_run_time_ms: 浮点型,测试运行时间(毫秒)。
  • error_type: 字符串类型,错误类型。
  • halstead_vocabulary: 整型,Halstead词汇量。
  • halstead_length: 整型,Halstead长度。
  • halstead_volume: 浮点型,Halstead体积。
  • halstead_difficulty: 浮点型,Halstead难度。
  • halstead_effort: 浮点型,Halstead工作量。
  • maintainability_index: 浮点型,可维护性指数。
  • n_func_defined: 整型,定义的函数数量。
  • entry_point_repeated: 布尔类型,入口点是否重复。

数据划分

  • 划分名称: train
  • 示例数量: 164
  • 字节大小: 20309

配置信息

  • 配置名称: default
  • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作