ASSERT-KTH/megadiff
收藏Hugging Face2023-09-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ASSERT-KTH/megadiff
下载链接
链接失效反馈官方服务:
资源简介:
Megadiff是一个包含Java源代码更改的数据集,这些更改根据差异大小进行了分类。数据集包含656,785个训练示例,总大小为16,904,390,254字节。每个示例包含源代码的差异信息、是否为单一代码块、是否为单一函数、错误函数和修复后的函数等特征。数据集主要用于代码更改的研究和分析。
Megadiff是一个包含Java源代码更改的数据集,这些更改根据差异大小进行了分类。数据集包含656,785个训练示例,总大小为16,904,390,254字节。每个示例包含源代码的差异信息、是否为单一代码块、是否为单一函数、错误函数和修复后的函数等特征。数据集主要用于代码更改的研究和分析。
提供机构:
ASSERT-KTH
原始信息汇总
数据集概述
数据集信息
-
特征列表:
diff: 类型为stringis_single_chunk: 类型为boolis_single_function: 类型为boolbuggy_function: 类型为stringfixed_function: 类型为string
-
数据分割:
train: 包含 656785 个样本,总字节数为 16904390254
-
数据集大小:
- 下载大小: 5369285762 字节
- 数据集大小: 16904390254 字节
配置信息
- 配置名称:
default- 数据文件:
train: 路径为data/train-*
- 数据文件:
其他信息
- 语言: 代码
- 美观名称:
megadiff - 大小类别: 100K < n < 1M



