five

ZHENGRAN/code_ujb_repair

收藏
Hugging Face2024-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ZHENGRAN/code_ujb_repair
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: test_sources list: - name: file dtype: string - name: method dtype: string - name: source dtype: string - name: buggy dtype: string - name: class_signature dtype: string - name: import_context dtype: string - name: location dtype: string - name: class_field_context dtype: string - name: end dtype: int64 - name: start dtype: int64 - name: prompt_complete dtype: string - name: code_context dtype: string - name: bug_id dtype: string - name: fix dtype: string - name: source_dir dtype: string - name: prompt_chat dtype: string - name: class_function_signature_context dtype: string - name: task_id dtype: string - name: testmethods sequence: string - name: function_signature dtype: string - name: project dtype: string - name: source dtype: string - name: indent dtype: string splits: - name: train num_bytes: 50291690 num_examples: 470 download_size: 12047521 dataset_size: 50291690 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征列表: - 名称:测试源(test_sources),类型为列表,其内部包含以下子字段: - 名称:文件(file),数据类型:字符串 - 名称:方法(method),数据类型:字符串 - 名称:源(source),数据类型:字符串 - 名称:缺陷代码(buggy),数据类型:字符串 - 名称:类签名(class_signature),数据类型:字符串 - 名称:导入上下文(import_context),数据类型:字符串 - 名称:位置(location),数据类型:字符串 - 名称:类字段上下文(class_field_context),数据类型:字符串 - 名称:结束位置(end),数据类型:int64 - 名称:起始位置(start),数据类型:int64 - 名称:完整提示词(prompt_complete),数据类型:字符串 - 名称:代码上下文(code_context),数据类型:字符串 - 名称:缺陷ID(bug_id),数据类型:字符串 - 名称:修复代码(fix),数据类型:字符串 - 名称:源目录(source_dir),数据类型:字符串 - 名称:对话式提示词(prompt_chat),数据类型:字符串 - 名称:类函数签名上下文(class_function_signature_context),数据类型:字符串 - 名称:任务ID(task_id),数据类型:字符串 - 名称:测试方法(testmethods),类型为字符串序列 - 名称:函数签名(function_signature),数据类型:字符串 - 名称:项目(project),数据类型:字符串 - 名称:源(source),数据类型:字符串 - 名称:缩进(indent),数据类型:字符串 数据集划分: - 划分名称:训练集(train),字节大小:50291690,样本数量:470 下载大小:12047521 数据集总大小:50291690 数据集配置: - 配置名称:默认配置(default),数据文件: - 对应划分:训练集(train),文件路径:data/train-*
提供机构:
ZHENGRAN
原始信息汇总

数据集概述

数据集特征

  • test_sources
    • file: 数据类型为字符串
    • method: 数据类型为字符串
    • source: 数据类型为字符串
  • buggy: 数据类型为字符串
  • class_signature: 数据类型为字符串
  • import_context: 数据类型为字符串
  • location: 数据类型为字符串
  • class_field_context: 数据类型为字符串
  • end: 数据类型为整数64位
  • start: 数据类型为整数64位
  • prompt_complete: 数据类型为字符串
  • code_context: 数据类型为字符串
  • bug_id: 数据类型为字符串
  • fix: 数据类型为字符串
  • source_dir: 数据类型为字符串
  • prompt_chat: 数据类型为字符串
  • class_function_signature_context: 数据类型为字符串
  • task_id: 数据类型为字符串
  • testmethods: 数据类型为字符串序列
  • function_signature: 数据类型为字符串
  • project: 数据类型为字符串
  • source: 数据类型为字符串
  • indent: 数据类型为字符串

数据集分割

  • train
    • 字节数: 50291690
    • 样本数: 470

数据集大小

  • 下载大小: 12047521 字节
  • 数据集大小: 50291690 字节

配置

  • default
    • 数据文件路径: data/train-*
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作