threite/github-issues
收藏Hugging Face2022-12-20 更新2024-04-21 收录
下载链接:
https://hf-mirror.com/datasets/threite/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: url
dtype: string
- name: repository_url
dtype: string
- name: labels_url
dtype: string
- name: comments_url
dtype: string
- name: events_url
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: node_id
dtype: string
- name: number
dtype: int64
- name: title
dtype: string
- name: user
struct:
- name: avatar_url
dtype: string
- name: events_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: gravatar_id
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: login
dtype: string
- name: node_id
dtype: string
- name: organizations_url
dtype: string
- name: received_events_url
dtype: string
- name: repos_url
dtype: string
- name: site_admin
dtype: bool
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: type
dtype: string
- name: url
dtype: string
- name: labels
list:
- name: color
dtype: string
- name: default
dtype: bool
- name: description
dtype: string
- name: id
dtype: int64
- name: name
dtype: string
- name: node_id
dtype: string
- name: url
dtype: string
- name: state
dtype: string
- name: locked
dtype: bool
- name: assignee
struct:
- name: avatar_url
dtype: string
- name: events_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: gravatar_id
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: login
dtype: string
- name: node_id
dtype: string
- name: organizations_url
dtype: string
- name: received_events_url
dtype: string
- name: repos_url
dtype: string
- name: site_admin
dtype: bool
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: type
dtype: string
- name: url
dtype: string
- name: assignees
list:
- name: avatar_url
dtype: string
- name: events_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: gravatar_id
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: login
dtype: string
- name: node_id
dtype: string
- name: organizations_url
dtype: string
- name: received_events_url
dtype: string
- name: repos_url
dtype: string
- name: site_admin
dtype: bool
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: type
dtype: string
- name: url
dtype: string
- name: milestone
struct:
- name: closed_at
dtype: string
- name: closed_issues
dtype: int64
- name: created_at
dtype: string
- name: creator
struct:
- name: avatar_url
dtype: string
- name: events_url
dtype: string
- name: followers_url
dtype: string
- name: following_url
dtype: string
- name: gists_url
dtype: string
- name: gravatar_id
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: login
dtype: string
- name: node_id
dtype: string
- name: organizations_url
dtype: string
- name: received_events_url
dtype: string
- name: repos_url
dtype: string
- name: site_admin
dtype: bool
- name: starred_url
dtype: string
- name: subscriptions_url
dtype: string
- name: type
dtype: string
- name: url
dtype: string
- name: description
dtype: string
- name: due_on
dtype: string
- name: html_url
dtype: string
- name: id
dtype: int64
- name: labels_url
dtype: string
- name: node_id
dtype: string
- name: number
dtype: int64
- name: open_issues
dtype: int64
- name: state
dtype: string
- name: title
dtype: string
- name: updated_at
dtype: string
- name: url
dtype: string
- name: comments
sequence: 'null'
- name: created_at
dtype: string
- name: updated_at
dtype: string
- name: closed_at
dtype: string
- name: author_association
dtype: string
- name: active_lock_reason
dtype: 'null'
- name: draft
dtype: bool
- name: pull_request
struct:
- name: diff_url
dtype: string
- name: html_url
dtype: string
- name: merged_at
dtype: string
- name: patch_url
dtype: string
- name: url
dtype: string
- name: body
dtype: string
- name: reactions
struct:
- name: '+1'
dtype: int64
- name: '-1'
dtype: int64
- name: confused
dtype: int64
- name: eyes
dtype: int64
- name: heart
dtype: int64
- name: hooray
dtype: int64
- name: laugh
dtype: int64
- name: rocket
dtype: int64
- name: total_count
dtype: int64
- name: url
dtype: string
- name: timeline_url
dtype: string
- name: performed_via_github_app
dtype: 'null'
- name: state_reason
dtype: string
- name: is_pull_request
dtype: bool
splits:
- name: train
num_bytes: 16275865
num_examples: 5392
download_size: 3809038
dataset_size: 16275865
---
# Dataset Card for "github-issues"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征项:
- 特征名称:统一资源定位符(Uniform Resource Locator,URL),数据类型:字符串(string)
- 特征名称:仓库URL(Repository URL),数据类型:字符串(string)
- 特征名称:标签URL(Labels URL),数据类型:字符串(string)
- 特征名称:评论URL(Comments URL),数据类型:字符串(string)
- 特征名称:事件URL(Events URL),数据类型:字符串(string)
- 特征名称:HTML统一资源定位符(HTML Uniform Resource Locator,HTML URL),数据类型:字符串(string)
- 特征名称:标识符(ID),数据类型:64位整数(int64)
- 特征名称:节点标识符(Node ID),数据类型:字符串(string)
- 特征名称:编号,数据类型:64位整数(int64)
- 特征名称:标题,数据类型:字符串(string)
- 特征名称:用户,结构体:
- 特征名称:头像URL(Avatar URL),数据类型:字符串(string)
- 特征名称:事件URL(Events URL),数据类型:字符串(string)
- 特征名称:关注者URL(Followers URL),数据类型:字符串(string)
- 特征名称:关注列表URL(Following URL),数据类型:字符串(string)
- 特征名称:代码片段URL(Gists URL),数据类型:字符串(string)
- 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string)
- 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string)
- 特征名称:标识符(ID),数据类型:64位整数(int64)
- 特征名称:登录名,数据类型:字符串(string)
- 特征名称:节点标识符(Node ID),数据类型:字符串(string)
- 特征名称:组织URL(Organizations URL),数据类型:字符串(string)
- 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string)
- 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string)
- 特征名称:站点管理员权限,数据类型:布尔值(bool)
- 特征名称:星标项目URL(Starred URL),数据类型:字符串(string)
- 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string)
- 特征名称:类型,数据类型:字符串(string)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:标签,列表类型:
- 特征名称:颜色值,数据类型:字符串(string)
- 特征名称:默认标签,数据类型:布尔值(bool)
- 特征名称:标签描述,数据类型:字符串(string)
- 特征名称:标识符(ID),数据类型:64位整数(int64)
- 特征名称:标签名称,数据类型:字符串(string)
- 特征名称:节点标识符(Node ID),数据类型:字符串(string)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:状态,数据类型:字符串(string)
- 特征名称:锁定状态,数据类型:布尔值(bool)
- 特征名称:经办人,结构体:
- 特征名称:头像URL(Avatar URL),数据类型:字符串(string)
- 特征名称:事件URL(Events URL),数据类型:字符串(string)
- 特征名称:关注者URL(Followers URL),数据类型:字符串(string)
- 特征名称:关注列表URL(Following URL),数据类型:字符串(string)
- 特征名称:代码片段URL(Gists URL),数据类型:字符串(string)
- 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string)
- 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string)
- 特征名称:标识符(ID),数据类型:64位整数(int64)
- 特征名称:登录名,数据类型:字符串(string)
- 特征名称:节点标识符(Node ID),数据类型:字符串(string)
- 特征名称:组织URL(Organizations URL),数据类型:字符串(string)
- 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string)
- 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string)
- 特征名称:站点管理员权限,数据类型:布尔值(bool)
- 特征名称:星标项目URL(Starred URL),数据类型:字符串(string)
- 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string)
- 特征名称:类型,数据类型:字符串(string)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:经办人列表,列表类型:
- 特征名称:头像URL(Avatar URL),数据类型:字符串(string)
- 特征名称:事件URL(Events URL),数据类型:字符串(string)
- 特征名称:关注者URL(Followers URL),数据类型:字符串(string)
- 特征名称:关注列表URL(Following URL),数据类型:字符串(string)
- 特征名称:代码片段URL(Gists URL),数据类型:字符串(string)
- 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string)
- 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string)
- 特征名称:标识符(ID),数据类型:64位整数(int64)
- 特征名称:登录名,数据类型:字符串(string)
- 特征名称:节点标识符(Node ID),数据类型:字符串(string)
- 特征名称:组织URL(Organizations URL),数据类型:字符串(string)
- 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string)
- 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string)
- 特征名称:站点管理员权限,数据类型:布尔值(bool)
- 特征名称:星标项目URL(Starred URL),数据类型:字符串(string)
- 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string)
- 特征名称:类型,数据类型:字符串(string)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:里程碑,结构体:
- 特征名称:关闭时间,数据类型:字符串(string)
- 特征名称:已关闭议题数量,数据类型:64位整数(int64)
- 特征名称:创建时间,数据类型:字符串(string)
- 特征名称:创建者,结构体:
- 特征名称:头像URL(Avatar URL),数据类型:字符串(string)
- 特征名称:事件URL(Events URL),数据类型:字符串(string)
- 特征名称:关注者URL(Followers URL),数据类型:字符串(string)
- 特征名称:关注列表URL(Following URL),数据类型:字符串(string)
- 特征名称:代码片段URL(Gists URL),数据类型:字符串(string)
- 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string)
- 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string)
- 特征名称:标识符(ID),数据类型:64位整数(int64)
- 特征名称:登录名,数据类型:字符串(string)
- 特征名称:节点标识符(Node ID),数据类型:字符串(string)
- 特征名称:组织URL(Organizations URL),数据类型:字符串(string)
- 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string)
- 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string)
- 特征名称:站点管理员权限,数据类型:布尔值(bool)
- 特征名称:星标项目URL(Starred URL),数据类型:字符串(string)
- 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string)
- 特征名称:类型,数据类型:字符串(string)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:里程碑描述,数据类型:字符串(string)
- 特征名称:截止时间,数据类型:字符串(string)
- 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string)
- 特征名称:标识符(ID),数据类型:64位整数(int64)
- 特征名称:标签URL(Labels URL),数据类型:字符串(string)
- 特征名称:节点标识符(Node ID),数据类型:字符串(string)
- 特征名称:编号,数据类型:64位整数(int64)
- 特征名称:未关闭议题数量,数据类型:64位整数(int64)
- 特征名称:状态,数据类型:字符串(string)
- 特征名称:标题,数据类型:字符串(string)
- 特征名称:更新时间,数据类型:字符串(string)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:评论,序列类型:空(null)
- 特征名称:创建时间,数据类型:字符串(string)
- 特征名称:更新时间,数据类型:字符串(string)
- 特征名称:关闭时间,数据类型:字符串(string)
- 特征名称:作者关联关系,数据类型:字符串(string)
- 特征名称:活跃锁定原因,数据类型:空(null)
- 特征名称:草稿状态,数据类型:布尔值(bool)
- 特征名称:拉取请求(Pull Request,PR),结构体:
- 特征名称:差异文件URL(Diff URL),数据类型:字符串(string)
- 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string)
- 特征名称:合并时间,数据类型:字符串(string)
- 特征名称:补丁文件URL(Patch URL),数据类型:字符串(string)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:议题正文,数据类型:字符串(string)
- 特征名称:反应(Reactions),结构体:
- 特征名称:点赞(+1),数据类型:64位整数(int64)
- 特征名称:点踩(-1),数据类型:64位整数(int64)
- 特征名称:困惑反应,数据类型:64位整数(int64)
- 特征名称:关注反应,数据类型:64位整数(int64)
- 特征名称:喜爱反应,数据类型:64位整数(int64)
- 特征名称:欢呼反应,数据类型:64位整数(int64)
- 特征名称:大笑反应,数据类型:64位整数(int64)
- 特征名称:推广反应,数据类型:64位整数(int64)
- 特征名称:总反应数,数据类型:64位整数(int64)
- 特征名称:统一资源定位符(URL),数据类型:字符串(string)
- 特征名称:时间线URL(Timeline URL),数据类型:字符串(string)
- 特征名称:通过GitHub应用执行,数据类型:空(null)
- 特征名称:状态原因,数据类型:字符串(string)
- 特征名称:是否为拉取请求,数据类型:布尔值(bool)
数据集划分:
- 划分名称:训练集,字节大小:16275865,样本数量:5392
下载总大小:3809038
数据集总大小:16275865
---
# 「github-issues」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
threite
原始信息汇总
数据集概述
数据集名称
"github-issues"
数据结构
-
基本特征:
url: 字符串repository_url: 字符串labels_url: 字符串comments_url: 字符串events_url: 字符串html_url: 字符串id: 整数node_id: 字符串number: 整数title: 字符串
-
用户信息:
user: 结构体,包含以下字段:avatar_url: 字符串events_url: 字符串followers_url: 字符串following_url: 字符串gists_url: 字符串gravatar_id: 字符串html_url: 字符串id: 整数login: 字符串node_id: 字符串organizations_url: 字符串received_events_url: 字符串repos_url: 字符串site_admin: 布尔值starred_url: 字符串subscriptions_url: 字符串type: 字符串url: 字符串
-
标签信息:
labels: 列表,包含以下字段:color: 字符串default: 布尔值description: 字符串id: 整数name: 字符串node_id: 字符串url: 字符串
-
状态与锁定:
state: 字符串locked: 布尔值
-
指派信息:
assignee: 结构体,包含与user相同的字段assignees: 列表,包含与user相同的字段
-
里程碑信息:
milestone: 结构体,包含以下字段:closed_at: 字符串closed_issues: 整数created_at: 字符串creator: 结构体,包含与user相同的字段description: 字符串due_on: 字符串html_url: 字符串id: 整数labels_url: 字符串node_id: 字符串number: 整数open_issues: 整数state: 字符串title: 字符串updated_at: 字符串url: 字符串
-
其他信息:
comments: 序列,值为nullcreated_at: 字符串updated_at: 字符串closed_at: 字符串author_association: 字符串active_lock_reason: 值为nulldraft: 布尔值pull_request: 结构体,包含以下字段:diff_url: 字符串html_url: 字符串merged_at: 字符串patch_url: 字符串url: 字符串
body: 字符串reactions: 结构体,包含以下字段:+1: 整数-1: 整数confused: 整数eyes: 整数heart: 整数hooray: 整数laugh: 整数rocket: 整数total_count: 整数url: 字符串
timeline_url: 字符串performed_via_github_app: 值为nullstate_reason: 字符串is_pull_request: 布尔值
数据集大小
- 下载大小: 3809038字节
- 数据集大小: 16275865字节
- 训练集大小: 16275865字节,包含5392个示例



