neko52/github-issues
收藏Hugging Face2024-06-19 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/neko52/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个与GitHub问题相关的字段,如url、repository_url、labels_url等,每个字段都有明确的数据类型定义。数据集还包含一个train划分,提供了该划分的字节大小和样本数量。
This dataset contains multiple fields related to GitHub issues, such as url, repository_url, labels_url, etc., each with a clear data type definition. The dataset also includes a train split, providing the byte size and number of examples for this split.
提供机构:
neko52
原始信息汇总
数据集概述
数据集特征
- url: 字符串类型
- repository_url: 字符串类型
- labels_url: 字符串类型
- comments_url: 字符串类型
- events_url: 字符串类型
- html_url: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- number: 64位整数类型
- title: 字符串类型
- user: 结构体类型
- login: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- avatar_url: 字符串类型
- gravatar_id: 字符串类型
- url: 字符串类型
- html_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- organizations_url: 字符串类型
- repos_url: 字符串类型
- events_url: 字符串类型
- received_events_url: 字符串类型
- type: 字符串类型
- site_admin: 布尔类型
- labels: 列表类型
- id: 64位整数类型
- node_id: 字符串类型
- url: 字符串类型
- name: 字符串类型
- color: 字符串类型
- default: 布尔类型
- description: 字符串类型
- state: 字符串类型
- locked: 布尔类型
- assignee: 结构体类型
- login: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- avatar_url: 字符串类型
- gravatar_id: 字符串类型
- url: 字符串类型
- html_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- organizations_url: 字符串类型
- repos_url: 字符串类型
- events_url: 字符串类型
- received_events_url: 字符串类型
- type: 字符串类型
- site_admin: 布尔类型
- assignees: 列表类型
- login: 字符串类型
- id: 64位整数类型
- node_id: 字符串类型
- avatar_url: 字符串类型
- gravatar_id: 字符串类型
- url: 字符串类型
- html_url: 字符串类型
- followers_url: 字符串类型
- following_url: 字符串类型
- gists_url: 字符串类型
- starred_url: 字符串类型
- subscriptions_url: 字符串类型
- organizations_url: 字符串类型
- repos_url: 字符串类型
- events_url: 字符串类型
- received_events_url: 字符串类型
- type: 字符串类型
- site_admin: 布尔类型
- milestone: 空类型
- comments: 字符串序列类型
- created_at: 时间戳类型
- updated_at: 时间戳类型
- closed_at: 时间戳类型
- author_association: 字符串类型
- active_lock_reason: 空类型
- body: 字符串类型
- reactions: 结构体类型
- url: 字符串类型
- total_count: 64位整数类型
- +1: 64位整数类型
- -1: 64位整数类型
- laugh: 64位整数类型
- hooray: 64位整数类型
- confused: 64位整数类型
- heart: 64位整数类型
- rocket: 64位整数类型
- eyes: 64位整数类型
- timeline_url: 字符串类型
- performed_via_github_app: 空类型
- state_reason: 字符串类型
- draft: 布尔类型
- pull_request: 结构体类型
- url: 字符串类型
- html_url: 字符串类型
- diff_url: 字符串类型
- patch_url: 字符串类型
- merged_at: 时间戳类型
- is_pull_request: 布尔类型
数据集分割
- train:
- 字节数: 392962
- 样本数: 96
数据集大小
- 下载大小: 143509 字节
- 数据集大小: 392962 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



