BanUrsus/github-issues_chapter5_section4
收藏Hugging Face2023-12-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BanUrsus/github-issues_chapter5_section4
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与GitHub问题相关的各种字段,包括URL、用户信息、标签、状态、分配者、里程碑、评论、时间戳和反应。数据集分为一个单一的train分割,包含4,990个示例,总大小为27,957,261字节。该数据集设计用于与GitHub问题分析和管理相关的任务。
该数据集包含与GitHub问题相关的各种字段,包括URL、用户信息、标签、状态、分配者、里程碑、评论、时间戳和反应。数据集分为一个单一的train分割,包含4,990个示例,总大小为27,957,261字节。该数据集设计用于与GitHub问题分析和管理相关的任务。
提供机构:
BanUrsus
原始信息汇总
数据集特征
基本信息
- url: 字符串类型
- repository_url: 字符串类型
- labels_url: 字符串类型
- comments_url: 字符串类型
- events_url: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- number: 64位整数类型
- title: 字符串类型
- state: 字符串类型
- locked: 布尔类型
- comments: 字符串序列
- created_at: 时间戳类型,UTC时区
- updated_at: 时间戳类型,UTC时区
- closed_at: 时间戳类型,UTC时区
- author_association: 字符串类型
- active_lock_reason: 64位浮点数类型
- draft: 64位浮点数类型
- body: 字符串类型
- timeline_url: 字符串类型
- performed_via_github_app: 64位浮点数类型
- state_reason: 字符串类型
- is_pull_request: 布尔类型
用户信息
- user: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
标签信息
- labels: 列表类型
- color: 字符串类型
- default: 布尔类型
- description: 字符串类型
- id: 64位整数类型
- name: 字符串类型
- node_id: 字符串类型
- url: 字符串类型
指派信息
- assignee: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
指派列表
- assignees: 列表类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
里程碑信息
- milestone: 结构体类型
- closed_at: 字符串类型
- closed_issues: 64位整数类型
- created_at: 字符串类型
- creator: 结构体类型
- avatar_url: 字符串类型
- events_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- gravatar_id: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- login: 字符串类型
- node_id: 字符串类型
- organizations_url: 字符串类型
- received_events_url: 字符串类型
- repos_url: 字符串类型
- site_admin: 布尔类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- type: 字符串类型
- url: 字符串类型
- description: 字符串类型
- due_on: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- labels_url: 字符串类型
- node_id: 字符串类型
- number: 64位整数类型
- open_issues: 64位整数类型
- state: 字符串类型
- title: 字符串类型
- updated_at: 字符串类型
- url: 字符串类型
拉取请求信息
- pull_request: 结构体类型
- diff_url: 字符串类型
- html_url: 字符串类型
- merged_at: 字符串类型
- patch_url: 字符串类型
- url: 字符串类型
反应信息
- reactions: 结构体类型
- +1: 64位整数类型
- -1: 64位整数类型
- confused: 64位整数类型
- eyes: 64位整数类型
- heart: 64位整数类型
- hooray: 64位整数类型
- laugh: 64位整数类型
- rocket: 64位整数类型
- total_count: 64位整数类型
- url: 字符串类型
数据集分割
- train:
- num_bytes: 27957261 字节
- num_examples: 4990 个样本
数据集大小
- download_size: 8696799 字节
- dataset_size: 27957261 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- split: train
- data_files:



