mcaldi03/github-issues
收藏Hugging Face2026-03-25 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/mcaldi03/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: url
dtype: string
- name: repository_url
dtype: string
- name: labels_url
dtype: string
- name: comments_url
dtype: string
- name: events_url
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: number
dtype: int64
- name: title
dtype: string
- name: user
struct:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: user_view_type
dtype: string
- name: site_admin
dtype: bool
- name: labels
list:
- name: id
dtype: int64
- name: node_id
dtype: string
- name: url
dtype: string
- name: name
dtype: string
- name: color
dtype: string
- name: default
dtype: bool
- name: description
dtype: string
- name: state
dtype: string
- name: locked
dtype: bool
- name: assignees
list:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: user_view_type
dtype: string
- name: site_admin
dtype: bool
- name: milestone
dtype: 'null'
- name: comments
list: string
- name: created_at
dtype: timestamp[s]
- name: updated_at
dtype: timestamp[s]
- name: closed_at
dtype: timestamp[s]
- name: assignee
struct:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: user_view_type
dtype: string
- name: site_admin
dtype: bool
- name: author_association
dtype: string
- name: type
dtype: 'null'
- name: active_lock_reason
dtype: 'null'
- name: draft
dtype: bool
- name: pull_request
struct:
- name: url
dtype: string
- name: html_url
dtype: string
- name: diff_url
dtype: string
- name: patch_url
dtype: string
- name: merged_at
dtype: timestamp[s]
- name: body
dtype: string
- name: closed_by
struct:
- name: login
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: avatar_url
dtype: string
- name: gravatar_id
dtype: string
- name: url
dtype: string
- name: html_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: organizations_url
dtype: string
- name: repos_url
dtype: string
- name: events_url
dtype: string
- name: received_events_url
dtype: string
- name: type
dtype: string
- name: user_view_type
dtype: string
- name: site_admin
dtype: bool
- name: reactions
struct:
- name: url
dtype: string
- name: total_count
dtype: int64
- name: '+1'
dtype: int64
- name: '-1'
dtype: int64
- name: laugh
dtype: int64
- name: hooray
dtype: int64
- name: confused
dtype: int64
- name: heart
dtype: int64
- name: rocket
dtype: int64
- name: eyes
dtype: int64
- name: timeline_url
dtype: string
- name: performed_via_github_app
dtype: 'null'
- name: state_reason
dtype: string
- name: sub_issues_summary
struct:
- name: total
dtype: int64
- name: completed
dtype: int64
- name: percent_completed
dtype: int64
- name: issue_dependencies_summary
struct:
- name: blocked_by
dtype: int64
- name: total_blocked_by
dtype: int64
- name: blocking
dtype: int64
- name: total_blocking
dtype: int64
- name: pinned_comment
dtype: 'null'
- name: is_pull_request
dtype: bool
splits:
- name: train
num_bytes: 4761681
num_examples: 1000
download_size: 3430166
dataset_size: 4761681
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 字段名:统一资源定位符(Uniform Resource Locator,URL),数据类型:字符串
- 字段名:仓库URL(Repository URL),数据类型:字符串
- 字段名:标签URL(Labels URL),数据类型:字符串
- 字段名:评论URL(Comments URL),数据类型:字符串
- 字段名:事件URL(Events URL),数据类型:字符串
- 字段名:HTML URL(HyperText Markup Language URL),数据类型:字符串
- 字段名:标识符(ID),数据类型:64位整数
- 字段名:节点ID(Node ID),数据类型:字符串
- 字段名:编号,数据类型:64位整数
- 字段名:标题,数据类型:字符串
- 字段名:用户信息,结构体类型,包含以下子字段:
- 字段名:登录名,数据类型:字符串
- 字段名:标识符(ID),数据类型:64位整数
- 字段名:节点ID(Node ID),数据类型:字符串
- 字段名:头像URL(Avatar URL),数据类型:字符串
- 字段名:Gravatar ID,数据类型:字符串
- 字段名:统一资源定位符(URL),数据类型:字符串
- 字段名:HTML URL,数据类型:字符串
- 字段名:关注者URL(Followers URL),数据类型:字符串
- 字段名:已关注URL(Following URL),数据类型:字符串
- 字段名:代码片段URL(Gists URL),数据类型:字符串
- 字段名:已加星标URL(Starred URL),数据类型:字符串
- 字段名:订阅URL(Subscriptions URL),数据类型:字符串
- 字段名:组织URL(Organizations URL),数据类型:字符串
- 字段名:仓库URL(Repositories URL),数据类型:字符串
- 字段名:事件URL(Events URL),数据类型:字符串
- 字段名:接收事件URL(Received Events URL),数据类型:字符串
- 字段名:类型,数据类型:字符串
- 字段名:用户视图类型,数据类型:字符串
- 字段名:站点管理员标识,布尔类型
- 字段名:标签列表,列表内元素为结构体,包含以下子字段:
- 字段名:标识符(ID),数据类型:64位整数
- 字段名:节点ID(Node ID),数据类型:字符串
- 字段名:统一资源定位符(URL),数据类型:字符串
- 字段名:名称,数据类型:字符串
- 字段名:颜色,数据类型:字符串
- 字段名:默认标识,布尔类型
- 字段名:描述信息,数据类型:字符串
- 字段名:状态,数据类型:字符串
- 字段名:锁定标识,布尔类型
- 字段名:被指派者列表,列表内元素为结构体,字段与前述用户信息结构体一致
- 字段名:里程碑,数据类型:空值
- 字段名:评论,字符串列表
- 字段名:创建时间,时间戳(单位:秒)
- 字段名:更新时间,时间戳(单位:秒)
- 字段名:关闭时间,时间戳(单位:秒)
- 字段名:被指派者,结构体类型,字段与前述用户信息结构体一致
- 字段名:作者关联关系,数据类型:字符串
- 字段名:类型,数据类型:空值
- 字段名:主动锁定原因,数据类型:空值
- 字段名:草稿标识,布尔类型
- 字段名:拉取请求(Pull Request,PR),结构体类型,包含以下子字段:
- 字段名:统一资源定位符(URL),数据类型:字符串
- 字段名:HTML URL,数据类型:字符串
- 字段名:差异URL(Diff URL),数据类型:字符串
- 字段名:补丁URL(Patch URL),数据类型:字符串
- 字段名:合并时间,时间戳(单位:秒)
- 字段名:正文内容,数据类型:字符串
- 字段名:关闭者,结构体类型,字段与前述用户信息结构体一致
- 字段名:反应信息,结构体类型,包含以下子字段:
- 字段名:统一资源定位符(URL),数据类型:字符串
- 字段名:总反应数,数据类型:64位整数
- 字段名:点赞(+1),数据类型:64位整数
- 字段名:点踩(-1),数据类型:64位整数
- 字段名:大笑反应,数据类型:64位整数
- 字段名:欢呼反应,数据类型:64位整数
- 字段名:困惑反应,数据类型:64位整数
- 字段名:红心反应,数据类型:64位整数
- 字段名:火箭反应,数据类型:64位整数
- 字段名:注视反应,数据类型:64位整数
- 字段名:时间线URL(Timeline URL),数据类型:字符串
- 字段名:GitHub应用执行标识,数据类型:空值
- 字段名:状态原因,数据类型:字符串
- 字段名:子问题摘要,结构体类型,包含以下子字段:
- 字段名:总数,数据类型:64位整数
- 字段名:已完成数,数据类型:64位整数
- 字段名:完成百分比,数据类型:64位整数
- 字段名:问题依赖摘要,结构体类型,包含以下子字段:
- 字段名:被阻塞数,数据类型:64位整数
- 字段名:总被阻塞数,数据类型:64位整数
- 字段名:阻塞其他数,数据类型:64位整数
- 字段名:总阻塞其他数,数据类型:64位整数
- 字段名:置顶评论,数据类型:空值
- 字段名:是否为拉取请求,布尔类型
数据集划分:
- 划分名称:训练集,字节数:4761681,样本数:1000
下载大小:3430166
数据集总大小:4761681
配置项:
- 配置名称:默认配置,数据文件配置:
- 划分:训练集,路径:data/train-*
提供机构:
mcaldi03



