lorisrossi/github-issues
收藏Hugging Face2024-02-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lorisrossi/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
该数据集仅用于测试。它包含与🤗 Datasets仓库相关的GitHub问题和拉取请求。可以用于语义搜索或多标签文本分类。每个GitHub问题的内容均为英文。
提供机构:
lorisrossi
原始信息汇总
数据集概述
基本信息
- 名称: HuggingFace Datasets GitHub Issues
- 语言: 英语
- 数据量: 1K<n<10K
- 任务类别: 文本分类
- 任务ID: 多标签分类
数据结构
- 特征:
- url: 字符串
- repository_url: 字符串
- labels_url: 字符串
- comments_url: 字符串
- events_url: 字符串
- html_url: 字符串
- id: 整数64位
- node_id: 字符串
- number: 整数64位
- title: 字符串
- user: 结构体
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- labels: 列表
- id: 整数64位
- node_id: 字符串
- url: 字符串
- name: 字符串
- color: 字符串
- default: 布尔值
- description: 字符串
- state: 字符串
- locked: 布尔值
- assignee: 结构体
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- assignees: 列表
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- milestone: 结构体
- url: 字符串
- html_url: 字符串
- labels_url: 字符串
- id: 整数64位
- node_id: 字符串
- number: 整数64位
- title: 字符串
- description: 字符串
- creator: 结构体
- login: 字符串
- id: 整数64位
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- open_issues: 整数64位
- closed_issues: 整数64位
- state: 字符串
- created_at: 时间戳[秒]
- updated_at: 时间戳[秒]
- due_on: 空
- closed_at: 空
- comments: 字符串序列
- created_at: 时间戳[秒]
- updated_at: 时间戳[秒]
- closed_at: 时间戳[秒]
- author_association: 字符串
- active_lock_reason: 空
- body: 字符串
- reactions: 结构体
- url: 字符串
- total_count: 整数64位
- +1: 整数64位
- -1: 整数64位
- laugh: 整数64位
- hooray: 整数64位
- confused: 整数64位
- heart: 整数64位
- rocket: 整数64位
- eyes: 整数64位
- timeline_url: 字符串
- performed_via_github_app: 空
- state_reason: 字符串
- draft: 布尔值
- pull_request: 结构体
- url: 字符串
- html_url: 字符串
- diff_url: 字符串
- patch_url: 字符串
- merged_at: 时间戳[秒]
- is_pull_request: 布尔值
数据分割
- train:
- 文件大小: 26192134 字节
- 样本数量: 3817
下载信息
- 下载大小: 7664986 字节
- 数据集大小: 26192134 字节
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



