gitbugactions/gitbug-java
收藏Hugging Face2024-11-06 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/gitbugactions/gitbug-java
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: bid
dtype: string
- name: pid
dtype: string
- name: repository
dtype: string
- name: language
dtype: string
- name: clone_url
dtype: string
- name: collection_timestamp
dtype: string
- name: commit_hash
dtype: string
- name: commit_message
dtype: string
- name: commit_timestamp
dtype: string
- name: previous_commit_hash
dtype: string
- name: previous_commit_message
dtype: string
- name: previous_commit_timestamp
dtype: string
- name: time_to_patch
dtype: string
- name: bug_patch
dtype: string
- name: bug_patch_file_extensions
sequence: string
- name: test_patch
dtype: string
- name: test_patch_file_extensions
sequence: string
- name: non_code_patch
dtype: string
- name: non_code_patch_file_extensions
sequence: string
- name: change_type
dtype: string
- name: actions_runs
list:
list:
- name: build_tool
dtype: string
- name: default_actions
dtype: bool
- name: elapsed_time
dtype: float64
- name: failed
dtype: bool
- name: tests
list:
- name: classname
dtype: string
- name: name
dtype: string
- name: results
list:
- name: message
dtype: string
- name: result
dtype: string
- name: type
dtype: string
- name: stderr
dtype: string
- name: stdout
dtype: string
- name: time
dtype: float64
- name: workflow
struct:
- name: path
dtype: string
- name: type
dtype: string
- name: workflow_name
dtype: string
- name: strategy
dtype: string
- name: issues
list:
- name: body
dtype: string
- name: comments
sequence: string
- name: id
dtype: int64
- name: is_pull_request
dtype: bool
- name: labels
list:
- name: description
dtype: string
- name: name
dtype: string
- name: review_comments
sequence: string
- name: title
dtype: string
splits:
- name: train
num_bytes: 50137466
num_examples: 199
download_size: 3434244
dataset_size: 50137466
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
dataset_info:
特征字段:
- 字段名: bid, 数据类型: 字符串
- 字段名: pid, 数据类型: 字符串
- 字段名: 代码仓库(repository), 数据类型: 字符串
- 字段名: 语言(language), 数据类型: 字符串
- 字段名: 克隆链接(clone_url), 数据类型: 字符串
- 字段名: 采集时间戳(collection_timestamp), 数据类型: 字符串
- 字段名: 提交哈希值(commit_hash), 数据类型: 字符串
- 字段名: 提交信息(commit_message), 数据类型: 字符串
- 字段名: 提交时间戳(commit_timestamp), 数据类型: 字符串
- 字段名: 前序提交哈希值(previous_commit_hash), 数据类型: 字符串
- 字段名: 前序提交信息(previous_commit_message), 数据类型: 字符串
- 字段名: 前序提交时间戳(previous_commit_timestamp), 数据类型: 字符串
- 字段名: 补丁耗时(time_to_patch), 数据类型: 字符串
- 字段名: 缺陷补丁(bug_patch), 数据类型: 字符串
- 字段名: 缺陷补丁文件扩展名(bug_patch_file_extensions), 数据类型: 字符串序列
- 字段名: 测试补丁(test_patch), 数据类型: 字符串
- 字段名: 测试补丁文件扩展名(test_patch_file_extensions), 数据类型: 字符串序列
- 字段名: 非代码补丁(non_code_patch), 数据类型: 字符串
- 字段名: 非代码补丁文件扩展名(non_code_patch_file_extensions), 数据类型: 字符串序列
- 字段名: 变更类型(change_type), 数据类型: 字符串
- 字段名: 工作流运行记录(actions_runs), 数据类型: 列表,列表元素为结构体,包含如下字段:
- 字段名: 构建工具(build_tool), 数据类型: 字符串
- 字段名: 默认操作(default_actions), 数据类型: 布尔值
- 字段名: 耗时(elapsed_time), 数据类型: 64位浮点数
- 字段名: 失败状态(failed), 数据类型: 布尔值
- 字段名: 测试项(tests), 数据类型: 列表,列表元素为结构体,包含:
- 字段名: 类名(classname), 数据类型: 字符串
- 字段名: 名称(name), 数据类型: 字符串
- 字段名: 测试结果(results), 数据类型: 列表,列表元素为结构体,包含:
- 字段名: 提示信息(message), 数据类型: 字符串
- 字段名: 结果状态(result), 数据类型: 字符串
- 字段名: 结果类型(type), 数据类型: 字符串
- 字段名: 标准错误输出(stderr), 数据类型: 字符串
- 字段名: 标准输出(stdout), 数据类型: 字符串
- 字段名: 耗时(time), 数据类型: 64位浮点数
- 字段名: 工作流(workflow), 数据类型: 结构体,包含:
- 字段名: 路径(path), 数据类型: 字符串
- 字段名: 类型(type), 数据类型: 字符串
- 字段名: 工作流名称(workflow_name), 数据类型: 字符串
- 字段名: 策略(strategy), 数据类型: 字符串
- 字段名: 问题工单(issues), 数据类型: 列表,列表元素为结构体,包含如下字段:
- 字段名: 工单内容(body), 数据类型: 字符串
- 字段名: 评论(comments), 数据类型: 字符串序列
- 字段名: 工单ID(id), 数据类型: 64位整数
- 字段名: 是否为拉取请求(is_pull_request), 数据类型: 布尔值
- 字段名: 标签(labels), 数据类型: 列表,列表元素为结构体,包含:
- 字段名: 标签描述(description), 数据类型: 字符串
- 字段名: 标签名称(name), 数据类型: 字符串
- 字段名: 评审评论(review_comments), 数据类型: 字符串序列
- 字段名: 工单标题(title), 数据类型: 字符串
数据划分:
- 划分名称: train(训练集), 数据字节数: 50137466, 样本数量: 199
下载大小: 3434244
数据集总大小: 50137466
配置项:
- 配置名称: default(默认配置), 数据文件:
- 数据划分: train(训练集), 文件路径: data/train-*
提供机构:
gitbugactions



