five

autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g9

收藏
Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g9
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含164个代码相关任务的执行记录与质量评估数据,主要特征包括:1) 任务标识符(task_id)和执行入口(entry_point);2) 可执行状态(is_executable)和正确性标记(is_correct);3) 测试通过/失败数量(tests_passed/tests_failed)及运行时间(test_run_time_ms);4) 错误类型(error_type);5) 代码复杂度指标:哈尔斯特德度量(词汇量、长度、体积、难度、工作量)和可维护性指数(maintainability_index)。数据集仅包含训练集,总大小18.8KB,适用于代码质量分析、自动测试验证等编程相关机器学习任务。
创建时间:
2026-03-23
原始信息汇总

数据集概述

数据集标识

  • 数据集名称: autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g9
  • 来源地址: https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g9

数据集结构与内容

  • 数据格式: 表格数据
  • 数据特征(列):
    1. task_id: 字符串类型,任务标识符。
    2. entry_point: 字符串类型,入口点。
    3. is_executable: 布尔类型,表示代码是否可执行。
    4. is_correct: 布尔类型,表示代码是否正确。
    5. tests_passed: 整型,通过的测试数量。
    6. tests_failed: 整型,失败的测试数量。
    7. test_run_time_ms: 浮点型,测试运行时间(毫秒)。
    8. error_type: 字符串类型,错误类型。
    9. halstead_vocabulary: 整型,Halstead词汇量。
    10. halstead_length: 整型,Halstead长度。
    11. halstead_volume: 浮点型,Halstead体积。
    12. halstead_difficulty: 浮点型,Halstead难度。
    13. halstead_effort: 浮点型,Halstead工作量。
    14. maintainability_index: 浮点型,可维护性指数。
    15. n_func_defined: 整型,定义的函数数量。
    16. entry_point_repeated: 布尔类型,入口点是否重复。
  • 数据划分:
    • 训练集 (train): 包含164个样本,数据大小为20,163字节。
  • 数据集大小:
    • 下载大小: 17,559字节
    • 数据集总大小: 20,163字节

配置信息

  • 默认配置: 数据文件路径为 data/train-*,对应训练集划分。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作