chathuranga-jayanath/context-5-predict-token-for-fine-tune-without-comments-from-maven-doxia-1.0-2
收藏Hugging Face2024-01-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chathuranga-jayanath/context-5-predict-token-for-fine-tune-without-comments-from-maven-doxia-1.0-2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: filepath
dtype: string
- name: start_bug_line
dtype: int64
- name: end_bug_line
dtype: int64
- name: bug
dtype: string
- name: fix
dtype: string
- name: ctx
dtype: string
splits:
- name: train
num_bytes: 215985
num_examples: 305
- name: validation
num_bytes: 26311
num_examples: 37
- name: test
num_bytes: 26596
num_examples: 37
download_size: 68312
dataset_size: 268892
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 名称:id,数据类型:64位整型
- 名称:filepath,数据类型:字符串
- 名称:start_bug_line,数据类型:64位整型
- 名称:end_bug_line,数据类型:64位整型
- 名称:bug,数据类型:字符串
- 名称:fix,数据类型:字符串
- 名称:ctx,数据类型:字符串
数据集划分:
- 划分名称:train,字节数:215985,样本数量:305
- 划分名称:validation,字节数:26311,样本数量:37
- 划分名称:test,字节数:26596,样本数量:37
下载大小:68312
总数据集大小:268892
配置项:
- 配置名称:default
数据文件映射:
- 划分:train,路径:data/train-*
- 划分:validation,路径:data/validation-*
- 划分:test,路径:data/test-*
提供机构:
chathuranga-jayanath
原始信息汇总
数据集概述
数据特征
- id: 数据类型为
int64 - filepath: 数据类型为
string - start_bug_line: 数据类型为
int64 - end_bug_line: 数据类型为
int64 - bug: 数据类型为
string - fix: 数据类型为
string - ctx: 数据类型为
string
数据分割
- train: 字节数为 215985,样本数为 305
- validation: 字节数为 26311,样本数为 37
- test: 字节数为 26596,样本数为 37
数据大小
- 下载大小: 68312 字节
- 数据集大小: 268892 字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



