chathuranga-jayanath/context-5-finmath-times4j-html-mavendoxia-wro4j-guava-supercsv-balanced-10k-prompt-1
收藏Hugging Face2024-02-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chathuranga-jayanath/context-5-finmath-times4j-html-mavendoxia-wro4j-guava-supercsv-balanced-10k-prompt-1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: filepath
dtype: string
- name: start_bug_line
dtype: int64
- name: end_bug_line
dtype: int64
- name: bug
dtype: string
- name: fix
dtype: string
- name: ctx
dtype: string
splits:
- name: train
num_bytes: 71451858
num_examples: 102195
- name: validation
num_bytes: 8884325
num_examples: 12774
- name: test
num_bytes: 8960466
num_examples: 12774
download_size: 37522248
dataset_size: 89296649
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征项:
- 名称:id,数据类型:int64
- 名称:filepath,数据类型:string
- 名称:start_bug_line,数据类型:int64,指代缺陷代码的起始行号
- 名称:end_bug_line,数据类型:int64,指代缺陷代码的结束行号
- 名称:bug,数据类型:string,指代含缺陷的代码片段
- 名称:fix,数据类型:string,指代修复后的代码片段
- 名称:ctx,数据类型:string,指代代码上下文片段
数据集划分:
- 划分名称:train,占用字节数:71451858,样本总量:102195
- 划分名称:validation,占用字节数:8884325,样本总量:12774
- 划分名称:test,占用字节数:8960466,样本总量:12774
下载总大小:37522248 字节
数据集总存储大小:89296649 字节
配置信息:
- 配置名称:default,数据文件映射如下:
- 训练集(train)对应路径:data/train-*
- 验证集(validation)对应路径:data/validation-*
- 测试集(test)对应路径:data/test-*
提供机构:
chathuranga-jayanath
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为int64
- filepath: 数据类型为string
- start_bug_line: 数据类型为int64
- end_bug_line: 数据类型为int64
- bug: 数据类型为string
- fix: 数据类型为string
- ctx: 数据类型为string
数据集分割
- train: 包含102195个样本,大小为71451858字节
- validation: 包含12774个样本,大小为8884325字节
- test: 包含12774个样本,大小为8960466字节
数据集大小
- 下载大小: 37522248字节
- 数据集大小: 89296649字节
配置
- config_name: default
- data_files:
- train: 路径为data/train-*
- validation: 路径为data/validation-*
- test: 路径为data/test-*
- data_files:



