five

autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g3

收藏
Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含164个训练样本,总大小18.9KB,主要存储编程相关任务的执行指标与代码质量数据。数据结构包含14个特征字段:任务ID(task_id)、入口点(entry_point)、可执行状态(is_executable)、正确性标识(is_correct)、通过/失败的测试案例数(tests_passed/failed)、测试运行时间(test_run_time_ms)、错误类型(error_type)等执行指标;以及Halstead复杂度指标(词汇量、长度、体积、难度、工作量)和可维护性指数(maintainability_index)等代码质量参数。数据以train单分割形式组织,适用于代码质量分析、程序正确性验证等软件工程研究任务。
创建时间:
2026-03-23
原始信息汇总

数据集概述

基本信息

  • 数据集名称: autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g3
  • 发布者: stefanocarrera
  • 数据来源: https://huggingface.co/datasets/stefanocarrera/autophagycode_D_metrics_he_Qwen3-8B_lr0.0001_trust_g3

数据集结构与内容

  • 数据格式: 结构化数据
  • 数据特征:
    • task_id: 任务标识符(字符串类型)
    • entry_point: 入口点(字符串类型)
    • is_executable: 是否可执行(布尔类型)
    • is_correct: 是否正确(布尔类型)
    • tests_passed: 通过的测试数(整数类型)
    • tests_failed: 失败的测试数(整数类型)
    • test_run_time_ms: 测试运行时间(毫秒,浮点数类型)
    • error_type: 错误类型(字符串类型)
    • halstead_vocabulary: 哈尔斯特德词汇量(整数类型)
    • halstead_length: 哈尔斯特德长度(整数类型)
    • halstead_volume: 哈尔斯特德体积(浮点数类型)
    • halstead_difficulty: 哈尔斯特德难度(浮点数类型)
    • halstead_effort: 哈尔斯特德工作量(浮点数类型)
    • maintainability_index: 可维护性指数(浮点数类型)
    • n_func_defined: 定义的函数数量(整数类型)
    • entry_point_repeated: 入口点是否重复(布尔类型)

数据规模

  • 数据划分: 仅包含训练集(train)
  • 训练集样本数量: 164
  • 训练集数据大小: 20,289 字节
  • 数据集总大小: 20,289 字节
  • 下载大小: 17,369 字节

配置信息

  • 默认配置名称: default
  • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作