five

threite/github-issues

收藏
Hugging Face2022-12-20 更新2024-04-21 收录
下载链接:
https://hf-mirror.com/datasets/threite/github-issues
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: url dtype: string - name: repository_url dtype: string - name: labels_url dtype: string - name: comments_url dtype: string - name: events_url dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: node_id dtype: string - name: number dtype: int64 - name: title dtype: string - name: user struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: labels list: - name: color dtype: string - name: default dtype: bool - name: description dtype: string - name: id dtype: int64 - name: name dtype: string - name: node_id dtype: string - name: url dtype: string - name: state dtype: string - name: locked dtype: bool - name: assignee struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: assignees list: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: milestone struct: - name: closed_at dtype: string - name: closed_issues dtype: int64 - name: created_at dtype: string - name: creator struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: description dtype: string - name: due_on dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: labels_url dtype: string - name: node_id dtype: string - name: number dtype: int64 - name: open_issues dtype: int64 - name: state dtype: string - name: title dtype: string - name: updated_at dtype: string - name: url dtype: string - name: comments sequence: 'null' - name: created_at dtype: string - name: updated_at dtype: string - name: closed_at dtype: string - name: author_association dtype: string - name: active_lock_reason dtype: 'null' - name: draft dtype: bool - name: pull_request struct: - name: diff_url dtype: string - name: html_url dtype: string - name: merged_at dtype: string - name: patch_url dtype: string - name: url dtype: string - name: body dtype: string - name: reactions struct: - name: '+1' dtype: int64 - name: '-1' dtype: int64 - name: confused dtype: int64 - name: eyes dtype: int64 - name: heart dtype: int64 - name: hooray dtype: int64 - name: laugh dtype: int64 - name: rocket dtype: int64 - name: total_count dtype: int64 - name: url dtype: string - name: timeline_url dtype: string - name: performed_via_github_app dtype: 'null' - name: state_reason dtype: string - name: is_pull_request dtype: bool splits: - name: train num_bytes: 16275865 num_examples: 5392 download_size: 3809038 dataset_size: 16275865 --- # Dataset Card for "github-issues" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征项: - 特征名称:统一资源定位符(Uniform Resource Locator,URL),数据类型:字符串(string) - 特征名称:仓库URL(Repository URL),数据类型:字符串(string) - 特征名称:标签URL(Labels URL),数据类型:字符串(string) - 特征名称:评论URL(Comments URL),数据类型:字符串(string) - 特征名称:事件URL(Events URL),数据类型:字符串(string) - 特征名称:HTML统一资源定位符(HTML Uniform Resource Locator,HTML URL),数据类型:字符串(string) - 特征名称:标识符(ID),数据类型:64位整数(int64) - 特征名称:节点标识符(Node ID),数据类型:字符串(string) - 特征名称:编号,数据类型:64位整数(int64) - 特征名称:标题,数据类型:字符串(string) - 特征名称:用户,结构体: - 特征名称:头像URL(Avatar URL),数据类型:字符串(string) - 特征名称:事件URL(Events URL),数据类型:字符串(string) - 特征名称:关注者URL(Followers URL),数据类型:字符串(string) - 特征名称:关注列表URL(Following URL),数据类型:字符串(string) - 特征名称:代码片段URL(Gists URL),数据类型:字符串(string) - 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string) - 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string) - 特征名称:标识符(ID),数据类型:64位整数(int64) - 特征名称:登录名,数据类型:字符串(string) - 特征名称:节点标识符(Node ID),数据类型:字符串(string) - 特征名称:组织URL(Organizations URL),数据类型:字符串(string) - 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string) - 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string) - 特征名称:站点管理员权限,数据类型:布尔值(bool) - 特征名称:星标项目URL(Starred URL),数据类型:字符串(string) - 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string) - 特征名称:类型,数据类型:字符串(string) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:标签,列表类型: - 特征名称:颜色值,数据类型:字符串(string) - 特征名称:默认标签,数据类型:布尔值(bool) - 特征名称:标签描述,数据类型:字符串(string) - 特征名称:标识符(ID),数据类型:64位整数(int64) - 特征名称:标签名称,数据类型:字符串(string) - 特征名称:节点标识符(Node ID),数据类型:字符串(string) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:状态,数据类型:字符串(string) - 特征名称:锁定状态,数据类型:布尔值(bool) - 特征名称:经办人,结构体: - 特征名称:头像URL(Avatar URL),数据类型:字符串(string) - 特征名称:事件URL(Events URL),数据类型:字符串(string) - 特征名称:关注者URL(Followers URL),数据类型:字符串(string) - 特征名称:关注列表URL(Following URL),数据类型:字符串(string) - 特征名称:代码片段URL(Gists URL),数据类型:字符串(string) - 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string) - 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string) - 特征名称:标识符(ID),数据类型:64位整数(int64) - 特征名称:登录名,数据类型:字符串(string) - 特征名称:节点标识符(Node ID),数据类型:字符串(string) - 特征名称:组织URL(Organizations URL),数据类型:字符串(string) - 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string) - 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string) - 特征名称:站点管理员权限,数据类型:布尔值(bool) - 特征名称:星标项目URL(Starred URL),数据类型:字符串(string) - 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string) - 特征名称:类型,数据类型:字符串(string) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:经办人列表,列表类型: - 特征名称:头像URL(Avatar URL),数据类型:字符串(string) - 特征名称:事件URL(Events URL),数据类型:字符串(string) - 特征名称:关注者URL(Followers URL),数据类型:字符串(string) - 特征名称:关注列表URL(Following URL),数据类型:字符串(string) - 特征名称:代码片段URL(Gists URL),数据类型:字符串(string) - 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string) - 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string) - 特征名称:标识符(ID),数据类型:64位整数(int64) - 特征名称:登录名,数据类型:字符串(string) - 特征名称:节点标识符(Node ID),数据类型:字符串(string) - 特征名称:组织URL(Organizations URL),数据类型:字符串(string) - 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string) - 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string) - 特征名称:站点管理员权限,数据类型:布尔值(bool) - 特征名称:星标项目URL(Starred URL),数据类型:字符串(string) - 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string) - 特征名称:类型,数据类型:字符串(string) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:里程碑,结构体: - 特征名称:关闭时间,数据类型:字符串(string) - 特征名称:已关闭议题数量,数据类型:64位整数(int64) - 特征名称:创建时间,数据类型:字符串(string) - 特征名称:创建者,结构体: - 特征名称:头像URL(Avatar URL),数据类型:字符串(string) - 特征名称:事件URL(Events URL),数据类型:字符串(string) - 特征名称:关注者URL(Followers URL),数据类型:字符串(string) - 特征名称:关注列表URL(Following URL),数据类型:字符串(string) - 特征名称:代码片段URL(Gists URL),数据类型:字符串(string) - 特征名称:Gravatar标识符(Gravatar ID),数据类型:字符串(string) - 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string) - 特征名称:标识符(ID),数据类型:64位整数(int64) - 特征名称:登录名,数据类型:字符串(string) - 特征名称:节点标识符(Node ID),数据类型:字符串(string) - 特征名称:组织URL(Organizations URL),数据类型:字符串(string) - 特征名称:接收事件URL(Received Events URL),数据类型:字符串(string) - 特征名称:仓库列表URL(Repos URL),数据类型:字符串(string) - 特征名称:站点管理员权限,数据类型:布尔值(bool) - 特征名称:星标项目URL(Starred URL),数据类型:字符串(string) - 特征名称:订阅列表URL(Subscriptions URL),数据类型:字符串(string) - 特征名称:类型,数据类型:字符串(string) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:里程碑描述,数据类型:字符串(string) - 特征名称:截止时间,数据类型:字符串(string) - 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string) - 特征名称:标识符(ID),数据类型:64位整数(int64) - 特征名称:标签URL(Labels URL),数据类型:字符串(string) - 特征名称:节点标识符(Node ID),数据类型:字符串(string) - 特征名称:编号,数据类型:64位整数(int64) - 特征名称:未关闭议题数量,数据类型:64位整数(int64) - 特征名称:状态,数据类型:字符串(string) - 特征名称:标题,数据类型:字符串(string) - 特征名称:更新时间,数据类型:字符串(string) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:评论,序列类型:空(null) - 特征名称:创建时间,数据类型:字符串(string) - 特征名称:更新时间,数据类型:字符串(string) - 特征名称:关闭时间,数据类型:字符串(string) - 特征名称:作者关联关系,数据类型:字符串(string) - 特征名称:活跃锁定原因,数据类型:空(null) - 特征名称:草稿状态,数据类型:布尔值(bool) - 特征名称:拉取请求(Pull Request,PR),结构体: - 特征名称:差异文件URL(Diff URL),数据类型:字符串(string) - 特征名称:HTML统一资源定位符(HTML URL),数据类型:字符串(string) - 特征名称:合并时间,数据类型:字符串(string) - 特征名称:补丁文件URL(Patch URL),数据类型:字符串(string) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:议题正文,数据类型:字符串(string) - 特征名称:反应(Reactions),结构体: - 特征名称:点赞(+1),数据类型:64位整数(int64) - 特征名称:点踩(-1),数据类型:64位整数(int64) - 特征名称:困惑反应,数据类型:64位整数(int64) - 特征名称:关注反应,数据类型:64位整数(int64) - 特征名称:喜爱反应,数据类型:64位整数(int64) - 特征名称:欢呼反应,数据类型:64位整数(int64) - 特征名称:大笑反应,数据类型:64位整数(int64) - 特征名称:推广反应,数据类型:64位整数(int64) - 特征名称:总反应数,数据类型:64位整数(int64) - 特征名称:统一资源定位符(URL),数据类型:字符串(string) - 特征名称:时间线URL(Timeline URL),数据类型:字符串(string) - 特征名称:通过GitHub应用执行,数据类型:空(null) - 特征名称:状态原因,数据类型:字符串(string) - 特征名称:是否为拉取请求,数据类型:布尔值(bool) 数据集划分: - 划分名称:训练集,字节大小:16275865,样本数量:5392 下载总大小:3809038 数据集总大小:16275865 --- # 「github-issues」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
threite
原始信息汇总

数据集概述

数据集名称

"github-issues"

数据结构

  • 基本特征:

    • url: 字符串
    • repository_url: 字符串
    • labels_url: 字符串
    • comments_url: 字符串
    • events_url: 字符串
    • html_url: 字符串
    • id: 整数
    • node_id: 字符串
    • number: 整数
    • title: 字符串
  • 用户信息:

    • user: 结构体,包含以下字段:
      • avatar_url: 字符串
      • events_url: 字符串
      • followers_url: 字符串
      • following_url: 字符串
      • gists_url: 字符串
      • gravatar_id: 字符串
      • html_url: 字符串
      • id: 整数
      • login: 字符串
      • node_id: 字符串
      • organizations_url: 字符串
      • received_events_url: 字符串
      • repos_url: 字符串
      • site_admin: 布尔值
      • starred_url: 字符串
      • subscriptions_url: 字符串
      • type: 字符串
      • url: 字符串
  • 标签信息:

    • labels: 列表,包含以下字段:
      • color: 字符串
      • default: 布尔值
      • description: 字符串
      • id: 整数
      • name: 字符串
      • node_id: 字符串
      • url: 字符串
  • 状态与锁定:

    • state: 字符串
    • locked: 布尔值
  • 指派信息:

    • assignee: 结构体,包含与user相同的字段
    • assignees: 列表,包含与user相同的字段
  • 里程碑信息:

    • milestone: 结构体,包含以下字段:
      • closed_at: 字符串
      • closed_issues: 整数
      • created_at: 字符串
      • creator: 结构体,包含与user相同的字段
      • description: 字符串
      • due_on: 字符串
      • html_url: 字符串
      • id: 整数
      • labels_url: 字符串
      • node_id: 字符串
      • number: 整数
      • open_issues: 整数
      • state: 字符串
      • title: 字符串
      • updated_at: 字符串
      • url: 字符串
  • 其他信息:

    • comments: 序列,值为null
    • created_at: 字符串
    • updated_at: 字符串
    • closed_at: 字符串
    • author_association: 字符串
    • active_lock_reason: 值为null
    • draft: 布尔值
    • pull_request: 结构体,包含以下字段:
      • diff_url: 字符串
      • html_url: 字符串
      • merged_at: 字符串
      • patch_url: 字符串
      • url: 字符串
    • body: 字符串
    • reactions: 结构体,包含以下字段:
      • +1: 整数
      • -1: 整数
      • confused: 整数
      • eyes: 整数
      • heart: 整数
      • hooray: 整数
      • laugh: 整数
      • rocket: 整数
      • total_count: 整数
      • url: 字符串
    • timeline_url: 字符串
    • performed_via_github_app: 值为null
    • state_reason: 字符串
    • is_pull_request: 布尔值

数据集大小

  • 下载大小: 3809038字节
  • 数据集大小: 16275865字节
  • 训练集大小: 16275865字节,包含5392个示例
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作