five

SatCat/github-issues

收藏
Hugging Face2022-12-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SatCat/github-issues
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: url dtype: string - name: repository_url dtype: string - name: labels_url dtype: string - name: comments_url dtype: string - name: events_url dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: node_id dtype: string - name: number dtype: int64 - name: title dtype: string - name: user struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: labels list: - name: color dtype: string - name: default dtype: bool - name: description dtype: string - name: id dtype: int64 - name: name dtype: string - name: node_id dtype: string - name: url dtype: string - name: state dtype: string - name: locked dtype: bool - name: assignee struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: assignees list: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: milestone struct: - name: closed_at dtype: string - name: closed_issues dtype: int64 - name: created_at dtype: string - name: creator struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: description dtype: string - name: due_on dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: labels_url dtype: string - name: node_id dtype: string - name: number dtype: int64 - name: open_issues dtype: int64 - name: state dtype: string - name: title dtype: string - name: updated_at dtype: string - name: url dtype: string - name: comments sequence: string - name: created_at dtype: string - name: updated_at dtype: string - name: closed_at dtype: string - name: author_association dtype: string - name: active_lock_reason dtype: 'null' - name: draft dtype: bool - name: pull_request struct: - name: diff_url dtype: string - name: html_url dtype: string - name: merged_at dtype: string - name: patch_url dtype: string - name: url dtype: string - name: body dtype: string - name: reactions struct: - name: '+1' dtype: int64 - name: '-1' dtype: int64 - name: confused dtype: int64 - name: eyes dtype: int64 - name: heart dtype: int64 - name: hooray dtype: int64 - name: laugh dtype: int64 - name: rocket dtype: int64 - name: total_count dtype: int64 - name: url dtype: string - name: timeline_url dtype: string - name: performed_via_github_app dtype: 'null' - name: state_reason dtype: string - name: is_pull_request dtype: bool splits: - name: train num_bytes: 20549193 num_examples: 5345 download_size: 5891736 dataset_size: 20549193 --- # Dataset Card for "github-issues" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征: - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:repository_url(仓库URL (Repository URL)),数据类型:字符串 - 名称:labels_url(标签URL (Labels URL)),数据类型:字符串 - 名称:comments_url(评论URL (Comments URL)),数据类型:字符串 - 名称:events_url(事件URL (Events URL)),数据类型:字符串 - 名称:html_url(HTML统一资源定位符 (HTML URL)),数据类型:字符串 - 名称:id,数据类型:64位整数 - 名称:node_id(节点ID),数据类型:字符串 - 名称:number,数据类型:64位整数 - 名称:title,数据类型:字符串 - 名称:user(用户),结构体: - 名称:avatar_url(头像URL (Avatar URL)),数据类型:字符串 - 名称:events_url(事件URL (Events URL)),数据类型:字符串 - 名称:followers_url(关注者URL (Followers URL)),数据类型:字符串 - 名称:following_url(已关注URL (Following URL)),数据类型:字符串 - 名称:gists_url(代码片段URL (Gists URL)),数据类型:字符串 - 名称:gravatar_id(Gravatar ID),数据类型:字符串 - 名称:html_url(HTML统一资源定位符 (HTML URL)),数据类型:字符串 - 名称:id,数据类型:64位整数 - 名称:login(登录名),数据类型:字符串 - 名称:node_id(节点ID),数据类型:字符串 - 名称:organizations_url(组织URL (Organizations URL)),数据类型:字符串 - 名称:received_events_url(接收事件URL (Received Events URL)),数据类型:字符串 - 名称:repos_url(仓库URL (Repos URL)),数据类型:字符串 - 名称:site_admin(站点管理员),数据类型:布尔值 - 名称:starred_url(已加星标URL (Starred URL)),数据类型:字符串 - 名称:subscriptions_url(订阅URL (Subscriptions URL)),数据类型:字符串 - 名称:type(类型),数据类型:字符串 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:labels(标签),列表: - 名称:color(颜色),数据类型:字符串 - 名称:default(默认),数据类型:布尔值 - 名称:description(描述),数据类型:字符串 - 名称:id,数据类型:64位整数 - 名称:name(名称),数据类型:字符串 - 名称:node_id(节点ID),数据类型:字符串 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:state(状态),数据类型:字符串 - 名称:locked(已锁定),数据类型:布尔值 - 名称:assignee(被指派人),结构体: - 名称:avatar_url(头像URL (Avatar URL)),数据类型:字符串 - 名称:events_url(事件URL (Events URL)),数据类型:字符串 - 名称:followers_url(关注者URL (Followers URL)),数据类型:字符串 - 名称:following_url(已关注URL (Following URL)),数据类型:字符串 - 名称:gists_url(代码片段URL (Gists URL)),数据类型:字符串 - 名称:gravatar_id(Gravatar ID),数据类型:字符串 - 名称:html_url(HTML统一资源定位符 (HTML URL)),数据类型:字符串 - 名称:id,数据类型:64位整数 - 名称:login(登录名),数据类型:字符串 - 名称:node_id(节点ID),数据类型:字符串 - 名称:organizations_url(组织URL (Organizations URL)),数据类型:字符串 - 名称:received_events_url(接收事件URL (Received Events URL)),数据类型:字符串 - 名称:repos_url(仓库URL (Repos URL)),数据类型:字符串 - 名称:site_admin(站点管理员),数据类型:布尔值 - 名称:starred_url(已加星标URL (Starred URL)),数据类型:字符串 - 名称:subscriptions_url(订阅URL (Subscriptions URL)),数据类型:字符串 - 名称:type(类型),数据类型:字符串 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:assignees(被指派人列表),列表: - 名称:avatar_url(头像URL (Avatar URL)),数据类型:字符串 - 名称:events_url(事件URL (Events URL)),数据类型:字符串 - 名称:followers_url(关注者URL (Followers URL)),数据类型:字符串 - 名称:following_url(已关注URL (Following URL)),数据类型:字符串 - 名称:gists_url(代码片段URL (Gists URL)),数据类型:字符串 - 名称:gravatar_id(Gravatar ID),数据类型:字符串 - 名称:html_url(HTML统一资源定位符 (HTML URL)),数据类型:字符串 - 名称:id,数据类型:64位整数 - 名称:login(登录名),数据类型:字符串 - 名称:node_id(节点ID),数据类型:字符串 - 名称:organizations_url(组织URL (Organizations URL)),数据类型:字符串 - 名称:received_events_url(接收事件URL (Received Events URL)),数据类型:字符串 - 名称:repos_url(仓库URL (Repos URL)),数据类型:字符串 - 名称:site_admin(站点管理员),数据类型:布尔值 - 名称:starred_url(已加星标URL (Starred URL)),数据类型:字符串 - 名称:subscriptions_url(订阅URL (Subscriptions URL)),数据类型:字符串 - 名称:type(类型),数据类型:字符串 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:milestone(里程碑),结构体: - 名称:closed_at(关闭时间),数据类型:字符串 - 名称:closed_issues(已关闭议题数),数据类型:64位整数 - 名称:created_at(创建时间),数据类型:字符串 - 名称:creator(创建者),结构体: - 名称:avatar_url(头像URL (Avatar URL)),数据类型:字符串 - 名称:events_url(事件URL (Events URL)),数据类型:字符串 - 名称:followers_url(关注者URL (Followers URL)),数据类型:字符串 - 名称:following_url(已关注URL (Following URL)),数据类型:字符串 - 名称:gists_url(代码片段URL (Gists URL)),数据类型:字符串 - 名称:gravatar_id(Gravatar ID),数据类型:字符串 - 名称:html_url(HTML统一资源定位符 (HTML URL)),数据类型:字符串 - 名称:id,数据类型:64位整数 - 名称:login(登录名),数据类型:字符串 - 名称:node_id(节点ID),数据类型:字符串 - 名称:organizations_url(组织URL (Organizations URL)),数据类型:字符串 - 名称:received_events_url(接收事件URL (Received Events URL)),数据类型:字符串 - 名称:repos_url(仓库URL (Repos URL)),数据类型:字符串 - 名称:site_admin(站点管理员),数据类型:布尔值 - 名称:starred_url(已加星标URL (Starred URL)),数据类型:字符串 - 名称:subscriptions_url(订阅URL (Subscriptions URL)),数据类型:字符串 - 名称:type(类型),数据类型:字符串 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:description(描述),数据类型:字符串 - 名称:due_on(截止日期),数据类型:字符串 - 名称:html_url(HTML统一资源定位符 (HTML URL)),数据类型:字符串 - 名称:id,数据类型:64位整数 - 名称:labels_url(标签URL (Labels URL)),数据类型:字符串 - 名称:node_id(节点ID),数据类型:字符串 - 名称:number(编号),数据类型:64位整数 - 名称:open_issues(开放议题数),数据类型:64位整数 - 名称:state(状态),数据类型:字符串 - 名称:title(标题),数据类型:字符串 - 名称:updated_at(更新时间),数据类型:字符串 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:comments(评论),字符串序列 - 名称:created_at(创建时间),数据类型:字符串 - 名称:updated_at(更新时间),数据类型:字符串 - 名称:closed_at(关闭时间),数据类型:字符串 - 名称:author_association(作者关联关系),数据类型:字符串 - 名称:active_lock_reason(主动锁定原因),数据类型:空值(null) - 名称:draft(草稿),数据类型:布尔值 - 名称:pull_request(拉取请求 (Pull Request)),结构体: - 名称:diff_url(差异URL (Diff URL)),数据类型:字符串 - 名称:html_url(HTML统一资源定位符 (HTML URL)),数据类型:字符串 - 名称:merged_at(合并时间),数据类型:字符串 - 名称:patch_url(补丁URL (Patch URL)),数据类型:字符串 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:body(内容),数据类型:字符串 - 名称:reactions(反应),结构体: - 名称:'+1'(点赞),数据类型:64位整数 - 名称:'-1'(踩),数据类型:64位整数 - 名称:confused(困惑),数据类型:64位整数 - 名称:eyes(注视),数据类型:64位整数 - 名称:heart(爱心),数据类型:64位整数 - 名称:hooray(喝彩),数据类型:64位整数 - 名称:laugh(大笑),数据类型:64位整数 - 名称:rocket(火箭),数据类型:64位整数 - 名称:total_count(总计数),数据类型:64位整数 - 名称:url(统一资源定位符 (Uniform Resource Locator)),数据类型:字符串 - 名称:timeline_url(时间线URL (Timeline URL)),数据类型:字符串 - 名称:performed_via_github_app(通过GitHub应用执行),数据类型:空值(null) - 名称:state_reason(状态原因),数据类型:字符串 - 名称:is_pull_request(是否为拉取请求 (Is Pull Request)),数据类型:布尔值 划分: - 划分名称:训练集(train),字节数:20549193,示例数量:5345 下载大小:5891736,数据集总大小:20549193 --- # “github-issues”数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
SatCat
原始信息汇总

数据集概述

数据集名称

"github-issues"

数据集特征

  1. 基本特征

    • url: 字符串
    • repository_url: 字符串
    • labels_url: 字符串
    • comments_url: 字符串
    • events_url: 字符串
    • html_url: 字符串
    • id: 整数
    • node_id: 字符串
    • number: 整数
    • title: 字符串
  2. 用户特征

    • user: 结构体,包含以下字段:
      • avatar_url: 字符串
      • events_url: 字符串
      • followers_url: 字符串
      • following_url: 字符串
      • gists_url: 字符串
      • gravatar_id: 字符串
      • html_url: 字符串
      • id: 整数
      • login: 字符串
      • node_id: 字符串
      • organizations_url: 字符串
      • received_events_url: 字符串
      • repos_url: 字符串
      • site_admin: 布尔值
      • starred_url: 字符串
      • subscriptions_url: 字符串
      • type: 字符串
      • url: 字符串
  3. 标签特征

    • labels: 列表,包含以下字段:
      • color: 字符串
      • default: 布尔值
      • description: 字符串
      • id: 整数
      • name: 字符串
      • node_id: 字符串
      • url: 字符串
  4. 状态和锁定特征

    • state: 字符串
    • locked: 布尔值
  5. 指派人特征

    • assignee: 结构体,包含与user相同的字段
  6. 指派人列表特征

    • assignees: 列表,包含与assignee相同的字段
  7. 里程碑特征

    • milestone: 结构体,包含以下字段:
      • closed_at: 字符串
      • closed_issues: 整数
      • created_at: 字符串
      • creator: 结构体,包含与user相同的字段
      • description: 字符串
      • due_on: 字符串
      • html_url: 字符串
      • id: 整数
      • labels_url: 字符串
      • node_id: 字符串
      • number: 整数
      • open_issues: 整数
      • state: 字符串
      • title: 字符串
      • updated_at: 字符串
      • url: 字符串
  8. 其他特征

    • comments: 字符串序列
    • created_at: 字符串
    • updated_at: 字符串
    • closed_at: 字符串
    • author_association: 字符串
    • active_lock_reason: 空值
    • draft: 布尔值
    • pull_request: 结构体,包含以下字段:
      • diff_url: 字符串
      • html_url: 字符串
      • merged_at: 字符串
      • patch_url: 字符串
      • url: 字符串
    • body: 字符串
    • reactions: 结构体,包含以下字段:
      • +1: 整数
      • -1: 整数
      • confused: 整数
      • eyes: 整数
      • heart: 整数
      • hooray: 整数
      • laugh: 整数
      • rocket: 整数
      • total_count: 整数
      • url: 字符串
    • timeline_url: 字符串
    • performed_via_github_app: 空值
    • state_reason: 字符串
    • is_pull_request: 布尔值

数据集分割

  • 训练集
    • 字节数: 20549193
    • 示例数: 5345

数据集大小

  • 下载大小: 5891736字节
  • 数据集大小: 20549193字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作