rizhiyi1983/github-issues-with-comments
收藏Hugging Face2024-07-16 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/rizhiyi1983/github-issues-with-comments
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了GitHub上的问题或拉取请求的详细信息,涵盖了多个字段,如URL、用户信息、标签、状态、评论、创建和更新时间等。数据集包含一个训练集,大小为21631364字节,包含7010个样本。
This dataset contains detailed information about issues or pull requests on GitHub, covering multiple fields such as URLs, user information, labels, status, comments, creation and update times, etc. The dataset includes a training set with a size of 21631364 bytes and contains 7010 samples.
提供机构:
rizhiyi1983
原始信息汇总
数据集概述
数据集特征
- url: 字符串类型
- repository_url: 字符串类型
- labels_url: 字符串类型
- comments_url: 字符串类型
- events_url: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- number: 64位整数类型
- title: 字符串类型
- user: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- labels: 列表类型
- color: 字符串类型
- default: 布尔类型
- description: 字符串类型
- id: 64位整数类型
- name: 字符串类型
- node_id: 字符串类型
- url: 字符串类型
- state: 字符串类型
- locked: 布尔类型
- assignee: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- assignees: 列表类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- milestone: 结构体类型
- closed_at: 字符串类型
- closed_issues: 64位整数类型
- created_at: 字符串类型
- creator: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- description: 字符串类型
- due_on: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- labels_url: 字符串类型
- node_id: 字符串类型
- number: 64位整数类型
- open_issues: 64位整数类型
- state: 字符串类型
- title: 字符串类型
- updated_at: 字符串类型
- url: 字符串类型
- comments: 64位整数类型
- created_at: 时间戳类型(纳秒,UTC时区)
- updated_at: 时间戳类型(纳秒,UTC时区)
- closed_at: 时间戳类型(纳秒,UTC时区)
- author_association: 字符串类型
- active_lock_reason: 64位浮点数类型
- body: 字符串类型
- reactions: 结构体类型
- +1: 64位整数类型
- -1: 64位整数类型
- confused: 64位整数类型
- eyes: 64位整数类型
- heart: 64位整数类型
- hooray: 64位整数类型
- laugh: 64位整数类型
- rocket: 64位整数类型
- total_count: 64位整数类型
- url: 字符串类型
- timeline_url: 字符串类型
- performed_via_github_app: 64位浮点数类型
- state_reason: 字符串类型
- draft: 64位浮点数类型
- pull_request: 结构体类型
- diff_url: 字符串类型
- html_url: 字符串类型
- merged_at: 字符串类型
- patch_url: 字符串类型
- url: 字符串类型
- is_pull_request: 布尔类型
数据集分割
- train:
- 字节数: 21631364
- 样本数: 7010
数据集大小
- 下载大小: 5334139 字节
- 数据集大小: 21631364 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



