five

autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7

收藏
Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与代码执行和质量评估相关的结构化数据。数据集包含164个训练样本,每个样本包含多个字段,如任务ID(task_id)、入口点(entry_point)、是否可执行(is_executable)、是否正确(is_correct)、通过和失败的测试数量(tests_passed, tests_failed)、测试运行时间(test_run_time_ms)、错误类型(error_type)等。此外,还包含一系列Halstead复杂度指标(如词汇量、长度、体积、难度、工作量)和可维护性指数(maintainability_index)。数据集适用于代码质量分析、自动化测试评估和软件工程研究等任务。
创建时间:
2026-03-23
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7
  • 存储库地址: https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_correct_g7
  • 数据量: 164 个示例
  • 数据集大小: 20,296 字节
  • 下载大小: 17,258 字节
  • 数据分割: 仅包含一个“train”分割

数据结构与特征

数据集包含以下字段:

标识与执行信息

  • task_id: 任务标识符(字符串类型)
  • entry_point: 入口点(字符串类型)
  • is_executable: 是否可执行(布尔类型)
  • is_correct: 是否正确(布尔类型)
  • tests_passed: 通过的测试数量(整数类型)
  • tests_failed: 失败的测试数量(整数类型)
  • test_run_time_ms: 测试运行时间(毫秒,浮点数类型)
  • error_type: 错误类型(字符串类型)

代码度量指标

  • halstead_vocabulary: 哈尔斯特德词汇量(整数类型)
  • halstead_length: 哈尔斯特德长度(整数类型)
  • halstead_volume: 哈尔斯特德体积(浮点数类型)
  • halstead_difficulty: 哈尔斯特德难度(浮点数类型)
  • halstead_effort: 哈尔斯特德工作量(浮点数类型)
  • maintainability_index: 可维护性指数(浮点数类型)
  • n_func_defined: 定义的函数数量(整数类型)
  • entry_point_repeated: 入口点是否重复(布尔类型)

数据配置

  • 配置名称: default
  • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作