sukrit-arora/github-issues
收藏Hugging Face2023-12-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sukrit-arora/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为HuggingFace Github Issues,主要包含与GitHub问题相关的数据,适用于文本分类和文本检索任务。数据集的特征包括问题的URL、标题、用户信息、标签、状态、评论、创建和更新时间等。数据集的大小在1K到10K之间,且为单语言(英语)数据集。
该数据集名为HuggingFace Github Issues,主要包含与GitHub问题相关的数据,适用于文本分类和文本检索任务。数据集的特征包括问题的URL、标题、用户信息、标签、状态、评论、创建和更新时间等。数据集的大小在1K到10K之间,且为单语言(英语)数据集。
提供机构:
sukrit-arora
原始信息汇总
数据集概述
基本信息
- 名称: HuggingFace Github Issues
- 语言: 英语
- 语言创建者: 发现
- 多语言性: 单语种
- 大小类别: 1K<n<10K
- 源数据集: 原始数据集
- 任务类别:
- 文本分类
- 文本检索
- 任务ID:
- 多类分类
- 多标签分类
- 文档检索
数据集特征
- url: 字符串
- repository_url: 字符串
- labels_url: 字符串
- comments_url: 字符串
- events_url: 字符串
- html_url: 字符串
- id: 整数64位
- node_id: 字符串
- number: 整数64位
- title: 字符串
- user: 结构体
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- labels: 列表
- id: 整数64位
- node_id: 字符串
- url: 字符串
- name: 字符串
- color: 字符串
- default: 布尔值
- description: 字符串
- state: 字符串
- locked: 布尔值
- assignee: 结构体
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- assignees: 列表
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- milestone: 结构体
- url: 字符串
- html_url: 字符串
- labels_url: 字符串
- id: 整数64位
- node_id: 字符串
- number: 整数64位
- title: 字符串
- description: 字符串
- creator: 结构体
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- open_issues: 整数64位
- closed_issues: 整数64位
- state: 字符串
- created_at: 时间戳[秒]
- updated_at: 时间戳[秒]
- due_on: 空
- closed_at: 空
- comments: 字符串序列
- created_at: 时间戳[秒]
- updated_at: 时间戳[秒]
- closed_at: 时间戳[秒]
- author_association: 字符串
- active_lock_reason: 空
- body: 字符串
- reactions: 结构体
- url: 字符串
- total_count: 整数64位
- +1: 整数64位
- -1: 整数64位
- laugh: 整数64位
- hooray: 整数64位
- confused: 整数64位
- heart: 整数64位
- rocket: 整数64位
- eyes: 整数64位
- timeline_url: 字符串
- performed_via_github_app: 空
- state_reason: 字符串
- draft: 布尔值
- pull_request: 结构体
- url: 字符串
- html_url: 字符串
- diff_url: 字符串
- patch_url: 字符串
- merged_at: 时间戳[秒]
- is_pull_request: 布尔值
数据集分割
- train:
- 字节数: 23410479
- 样本数: 3000
数据集大小
- 下载大小: 6521212
- 数据集大小: 23410479
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



