ZHENGRAN/code_ujb_repair
收藏Hugging Face2024-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ZHENGRAN/code_ujb_repair
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: test_sources
list:
- name: file
dtype: string
- name: method
dtype: string
- name: source
dtype: string
- name: buggy
dtype: string
- name: class_signature
dtype: string
- name: import_context
dtype: string
- name: location
dtype: string
- name: class_field_context
dtype: string
- name: end
dtype: int64
- name: start
dtype: int64
- name: prompt_complete
dtype: string
- name: code_context
dtype: string
- name: bug_id
dtype: string
- name: fix
dtype: string
- name: source_dir
dtype: string
- name: prompt_chat
dtype: string
- name: class_function_signature_context
dtype: string
- name: task_id
dtype: string
- name: testmethods
sequence: string
- name: function_signature
dtype: string
- name: project
dtype: string
- name: source
dtype: string
- name: indent
dtype: string
splits:
- name: train
num_bytes: 50291690
num_examples: 470
download_size: 12047521
dataset_size: 50291690
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征列表:
- 名称:测试源(test_sources),类型为列表,其内部包含以下子字段:
- 名称:文件(file),数据类型:字符串
- 名称:方法(method),数据类型:字符串
- 名称:源(source),数据类型:字符串
- 名称:缺陷代码(buggy),数据类型:字符串
- 名称:类签名(class_signature),数据类型:字符串
- 名称:导入上下文(import_context),数据类型:字符串
- 名称:位置(location),数据类型:字符串
- 名称:类字段上下文(class_field_context),数据类型:字符串
- 名称:结束位置(end),数据类型:int64
- 名称:起始位置(start),数据类型:int64
- 名称:完整提示词(prompt_complete),数据类型:字符串
- 名称:代码上下文(code_context),数据类型:字符串
- 名称:缺陷ID(bug_id),数据类型:字符串
- 名称:修复代码(fix),数据类型:字符串
- 名称:源目录(source_dir),数据类型:字符串
- 名称:对话式提示词(prompt_chat),数据类型:字符串
- 名称:类函数签名上下文(class_function_signature_context),数据类型:字符串
- 名称:任务ID(task_id),数据类型:字符串
- 名称:测试方法(testmethods),类型为字符串序列
- 名称:函数签名(function_signature),数据类型:字符串
- 名称:项目(project),数据类型:字符串
- 名称:源(source),数据类型:字符串
- 名称:缩进(indent),数据类型:字符串
数据集划分:
- 划分名称:训练集(train),字节大小:50291690,样本数量:470
下载大小:12047521
数据集总大小:50291690
数据集配置:
- 配置名称:默认配置(default),数据文件:
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
ZHENGRAN
原始信息汇总
数据集概述
数据集特征
- test_sources
- file: 数据类型为字符串
- method: 数据类型为字符串
- source: 数据类型为字符串
- buggy: 数据类型为字符串
- class_signature: 数据类型为字符串
- import_context: 数据类型为字符串
- location: 数据类型为字符串
- class_field_context: 数据类型为字符串
- end: 数据类型为整数64位
- start: 数据类型为整数64位
- prompt_complete: 数据类型为字符串
- code_context: 数据类型为字符串
- bug_id: 数据类型为字符串
- fix: 数据类型为字符串
- source_dir: 数据类型为字符串
- prompt_chat: 数据类型为字符串
- class_function_signature_context: 数据类型为字符串
- task_id: 数据类型为字符串
- testmethods: 数据类型为字符串序列
- function_signature: 数据类型为字符串
- project: 数据类型为字符串
- source: 数据类型为字符串
- indent: 数据类型为字符串
数据集分割
- train
- 字节数: 50291690
- 样本数: 470
数据集大小
- 下载大小: 12047521 字节
- 数据集大小: 50291690 字节
配置
- default
- 数据文件路径:
data/train-*
- 数据文件路径:
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



