five

serhii-korobchenko/github-issues-with-comments

收藏
Hugging Face2024-02-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/serhii-korobchenko/github-issues-with-comments
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: state dtype: string - name: created_at dtype: string - name: active_lock_reason dtype: 'null' - name: url dtype: string - name: assignee struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: reactions struct: - name: '+1' dtype: int64 - name: '-1' dtype: int64 - name: confused dtype: int64 - name: eyes dtype: int64 - name: heart dtype: int64 - name: hooray dtype: int64 - name: laugh dtype: int64 - name: rocket dtype: int64 - name: total_count dtype: int64 - name: url dtype: string - name: draft dtype: bool - name: labels_url dtype: string - name: user struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: html_url dtype: string - name: assignees list: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: locked dtype: bool - name: updated_at dtype: string - name: closed_at dtype: string - name: milestone struct: - name: closed_at dtype: string - name: closed_issues dtype: int64 - name: created_at dtype: string - name: creator struct: - name: avatar_url dtype: string - name: events_url dtype: string - name: followers_url dtype: string - name: following_url dtype: string - name: gists_url dtype: string - name: gravatar_id dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: login dtype: string - name: node_id dtype: string - name: organizations_url dtype: string - name: received_events_url dtype: string - name: repos_url dtype: string - name: site_admin dtype: bool - name: starred_url dtype: string - name: subscriptions_url dtype: string - name: type dtype: string - name: url dtype: string - name: description dtype: string - name: due_on dtype: string - name: html_url dtype: string - name: id dtype: int64 - name: labels_url dtype: string - name: node_id dtype: string - name: number dtype: int64 - name: open_issues dtype: int64 - name: state dtype: string - name: title dtype: string - name: updated_at dtype: string - name: url dtype: string - name: comments sequence: string - name: state_reason dtype: string - name: labels list: - name: color dtype: string - name: default dtype: bool - name: description dtype: string - name: id dtype: int64 - name: name dtype: string - name: node_id dtype: string - name: url dtype: string - name: title dtype: string - name: author_association dtype: string - name: timeline_url dtype: string - name: body dtype: string - name: repository_url dtype: string - name: pull_request struct: - name: diff_url dtype: string - name: html_url dtype: string - name: merged_at dtype: string - name: patch_url dtype: string - name: url dtype: string - name: id dtype: int64 - name: comments_url dtype: string - name: node_id dtype: string - name: performed_via_github_app dtype: 'null' - name: number dtype: int64 - name: events_url dtype: string - name: is_pull_request dtype: bool splits: - name: train num_bytes: 30883760 num_examples: 5000 download_size: 9046316 dataset_size: 30883760 configs: - config_name: default data_files: - split: train path: data/train-* ---

dataset_info: 特征: - 名称: state 数据类型: string - 名称: created_at 数据类型: string - 名称: active_lock_reason 数据类型: 'null' - 名称: url 数据类型: string - 名称: assignee 结构体: - 名称: avatar_url 数据类型: string - 名称: events_url 数据类型: string - 名称: followers_url 数据类型: string - 名称: following_url 数据类型: string - 名称: gists_url 数据类型: string - 名称: gravatar_id 数据类型: string - 名称: html_url 数据类型: string - 名称: id 数据类型: int64 - 名称: login 数据类型: string - 名称: node_id 数据类型: string - 名称: organizations_url 数据类型: string - 名称: received_events_url 数据类型: string - 名称: repos_url 数据类型: string - 名称: site_admin 数据类型: bool - 名称: starred_url 数据类型: string - 名称: subscriptions_url 数据类型: string - 名称: type 数据类型: string - 名称: url 数据类型: string - 名称: reactions 结构体: - 名称: '+1' 数据类型: int64 - 名称: '-1' 数据类型: int64 - 名称: confused 数据类型: int64 - 名称: eyes 数据类型: int64 - 名称: heart 数据类型: int64 - 名称: hooray 数据类型: int64 - 名称: laugh 数据类型: int64 - 名称: rocket 数据类型: int64 - 名称: total_count 数据类型: int64 - 名称: url 数据类型: string - 名称: draft 数据类型: bool - 名称: labels_url 数据类型: string - 名称: user 结构体: - 名称: avatar_url 数据类型: string - 名称: events_url 数据类型: string - 名称: followers_url 数据类型: string - 名称: following_url 数据类型: string - 名称: gists_url 数据类型: string - 名称: gravatar_id 数据类型: string - 名称: html_url 数据类型: string - 名称: id 数据类型: int64 - 名称: login 数据类型: string - 名称: node_id 数据类型: string - 名称: organizations_url 数据类型: string - 名称: received_events_url 数据类型: string - 名称: repos_url 数据类型: string - 名称: site_admin 数据类型: bool - 名称: starred_url 数据类型: string - 名称: subscriptions_url 数据类型: string - 名称: type 数据类型: string - 名称: url 数据类型: string - 名称: html_url 数据类型: string - 名称: assignees 列表: - 名称: avatar_url 数据类型: string - 名称: events_url 数据类型: string - 名称: followers_url 数据类型: string - 名称: following_url 数据类型: string - 名称: gists_url 数据类型: string - 名称: gravatar_id 数据类型: string - 名称: html_url 数据类型: string - 名称: id 数据类型: int64 - 名称: login 数据类型: string - 名称: node_id 数据类型: string - 名称: organizations_url 数据类型: string - 名称: received_events_url 数据类型: string - 名称: repos_url 数据类型: string - 名称: site_admin 数据类型: bool - 名称: starred_url 数据类型: string - 名称: subscriptions_url 数据类型: string - 名称: type 数据类型: string - 名称: url 数据类型: string - 名称: locked 数据类型: bool - 名称: updated_at 数据类型: string - 名称: closed_at 数据类型: string - 名称: milestone 结构体: - 名称: closed_at 数据类型: string - 名称: closed_issues 数据类型: int64 - 名称: created_at 数据类型: string - 名称: creator 结构体: - 名称: avatar_url 数据类型: string - 名称: events_url 数据类型: string - 名称: followers_url 数据类型: string - 名称: following_url 数据类型: string - 名称: gists_url 数据类型: string - 名称: gravatar_id 数据类型: string - 名称: html_url 数据类型: string - 名称: id 数据类型: int64 - 名称: login 数据类型: string - 名称: node_id 数据类型: string - 名称: organizations_url 数据类型: string - 名称: received_events_url 数据类型: string - 名称: repos_url 数据类型: string - 名称: site_admin 数据类型: bool - 名称: starred_url 数据类型: string - 名称: subscriptions_url 数据类型: string - 名称: type 数据类型: string - 名称: url 数据类型: string - 名称: description 数据类型: string - 名称: due_on 数据类型: string - 名称: html_url 数据类型: string - 名称: id 数据类型: int64 - 名称: labels_url 数据类型: string - 名称: node_id 数据类型: string - 名称: number 数据类型: int64 - 名称: open_issues 数据类型: int64 - 名称: state 数据类型: string - 名称: title 数据类型: string - 名称: updated_at 数据类型: string - 名称: url 数据类型: string - 名称: comments 序列: string - 名称: state_reason 数据类型: string - 名称: labels 列表: - 名称: color 数据类型: string - 名称: default 数据类型: bool - 名称: description 数据类型: string - 名称: id 数据类型: int64 - 名称: name 数据类型: string - 名称: node_id 数据类型: string - 名称: url 数据类型: string - 名称: title 数据类型: string - 名称: author_association 数据类型: string - 名称: timeline_url 数据类型: string - 名称: body 数据类型: string - 名称: repository_url 数据类型: string - 名称: pull_request 结构体: - 名称: diff_url 数据类型: string - 名称: html_url 数据类型: string - 名称: merged_at 数据类型: string - 名称: patch_url 数据类型: string - 名称: url 数据类型: string - 名称: id 数据类型: int64 - 名称: comments_url 数据类型: string - 名称: node_id 数据类型: string - 名称: performed_via_github_app 数据类型: 'null' - 名称: number 数据类型: int64 - 名称: events_url 数据类型: string - 名称: is_pull_request 数据类型: bool 拆分: - 名称: train 字节数: 30883760 样本数: 5000 下载大小: 9046316 数据集大小: 30883760 配置: - 配置名称: default 数据文件: - 拆分: train 路径: data/train-*
提供机构:
serhii-korobchenko
原始信息汇总

数据集特征

基本特征

  • state: 字符串类型
  • created_at: 字符串类型
  • active_lock_reason: 空类型
  • url: 字符串类型
  • draft: 布尔类型
  • labels_url: 字符串类型
  • html_url: 字符串类型
  • locked: 布尔类型
  • updated_at: 字符串类型
  • closed_at: 字符串类型
  • comments: 字符串序列
  • state_reason: 字符串类型
  • title: 字符串类型
  • author_association: 字符串类型
  • timeline_url: 字符串类型
  • body: 字符串类型
  • repository_url: 字符串类型
  • id: 整数类型
  • comments_url: 字符串类型
  • node_id: 字符串类型
  • performed_via_github_app: 空类型
  • number: 整数类型
  • events_url: 字符串类型
  • is_pull_request: 布尔类型

结构化特征

  • assignee:

    • avatar_url: 字符串类型
    • events_url: 字符串类型
    • followers_url: 字符串类型
    • following_url: 字符串类型
    • gists_url: 字符串类型
    • gravatar_id: 字符串类型
    • html_url: 字符串类型
    • id: 整数类型
    • login: 字符串类型
    • node_id: 字符串类型
    • organizations_url: 字符串类型
    • received_events_url: 字符串类型
    • repos_url: 字符串类型
    • site_admin: 布尔类型
    • starred_url: 字符串类型
    • subscriptions_url: 字符串类型
    • type: 字符串类型
    • url: 字符串类型
  • reactions:

    • +1: 整数类型
    • -1: 整数类型
    • confused: 整数类型
    • eyes: 整数类型
    • heart: 整数类型
    • hooray: 整数类型
    • laugh: 整数类型
    • rocket: 整数类型
    • total_count: 整数类型
    • url: 字符串类型
  • user:

    • avatar_url: 字符串类型
    • events_url: 字符串类型
    • followers_url: 字符串类型
    • following_url: 字符串类型
    • gists_url: 字符串类型
    • gravatar_id: 字符串类型
    • html_url: 字符串类型
    • id: 整数类型
    • login: 字符串类型
    • node_id: 字符串类型
    • organizations_url: 字符串类型
    • received_events_url: 字符串类型
    • repos_url: 字符串类型
    • site_admin: 布尔类型
    • starred_url: 字符串类型
    • subscriptions_url: 字符串类型
    • type: 字符串类型
    • url: 字符串类型
  • assignees:

    • avatar_url: 字符串类型
    • events_url: 字符串类型
    • followers_url: 字符串类型
    • following_url: 字符串类型
    • gists_url: 字符串类型
    • gravatar_id: 字符串类型
    • html_url: 字符串类型
    • id: 整数类型
    • login: 字符串类型
    • node_id: 字符串类型
    • organizations_url: 字符串类型
    • received_events_url: 字符串类型
    • repos_url: 字符串类型
    • site_admin: 布尔类型
    • starred_url: 字符串类型
    • subscriptions_url: 字符串类型
    • type: 字符串类型
    • url: 字符串类型
  • milestone:

    • closed_at: 字符串类型
    • closed_issues: 整数类型
    • created_at: 字符串类型
    • creator:
      • avatar_url: 字符串类型
      • events_url: 字符串类型
      • followers_url: 字符串类型
      • following_url: 字符串类型
      • gists_url: 字符串类型
      • gravatar_id: 字符串类型
      • html_url: 字符串类型
      • id: 整数类型
      • login: 字符串类型
      • node_id: 字符串类型
      • organizations_url: 字符串类型
      • received_events_url: 字符串类型
      • repos_url: 字符串类型
      • site_admin: 布尔类型
      • starred_url: 字符串类型
      • subscriptions_url: 字符串类型
      • type: 字符串类型
      • url: 字符串类型
    • description: 字符串类型
    • due_on: 字符串类型
    • html_url: 字符串类型
    • id: 整数类型
    • labels_url: 字符串类型
    • node_id: 字符串类型
    • number: 整数类型
    • open_issues: 整数类型
    • state: 字符串类型
    • title: 字符串类型
    • updated_at: 字符串类型
    • url: 字符串类型
  • labels:

    • color: 字符串类型
    • default: 布尔类型
    • description: 字符串类型
    • id: 整数类型
    • name: 字符串类型
    • node_id: 字符串类型
    • url: 字符串类型
  • pull_request:

    • diff_url: 字符串类型
    • html_url: 字符串类型
    • merged_at: 字符串类型
    • patch_url: 字符串类型
    • url: 字符串类型

数据集分割

  • train:
    • num_bytes: 30883760
    • num_examples: 5000

数据集大小

  • download_size: 9046316
  • dataset_size: 30883760

配置

  • config_name: default
    • data_files:
      • split: train
        • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作