mdroth/github_issues_300
收藏Hugging Face2023-07-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mdroth/github_issues_300
下载链接
链接失效反馈官方服务:
资源简介:
GitHub issues数据集,如Hugging Face课程中所述,但限制为300个问题。
提供机构:
mdroth
原始信息汇总
数据集描述
数据集概要
GitHub issues 数据集,限制为 300 个问题。
支持的任务和排行榜
- 可接受性分类
- 主题分类
语言
- 英语(美国)
数据集结构
数据实例
数据集包含多个字段,每个字段有特定的数据类型。
数据字段
- url: 字符串
- repository_url: 字符串
- labels_url: 字符串
- comments_url: 字符串
- events_url: 字符串
- html_url: 字符串
- id: 整数
- node_id: 字符串
- number: 整数
- title: 字符串
- user: 结构体
- login: 字符串
- id: 整数
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- labels: 列表
- id: 整数
- node_id: 字符串
- url: 字符串
- name: 字符串
- color: 字符串
- default: 布尔值
- description: 字符串
- state: 字符串
- locked: 布尔值
- assignee: 结构体
- login: 字符串
- id: 整数
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- assignees: 列表
- login: 字符串
- id: 整数
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- milestone: 结构体
- url: 字符串
- html_url: 字符串
- labels_url: 字符串
- id: 整数
- node_id: 字符串
- number: 整数
- title: 字符串
- description: 字符串
- creator: 结构体
- login: 字符串
- id: 整数
- node_id: 字符串
- avatar_url: 字符串
- gravatar_id: 字符串
- url: 字符串
- html_url: 字符串
- followers_url: 字符串
- following_url: 字符串
- gists_url: 字符串
- starred_url: 字符串
- subscriptions_url: 字符串
- organizations_url: 字符串
- repos_url: 字符串
- events_url: 字符串
- received_events_url: 字符串
- type: 字符串
- site_admin: 布尔值
- open_issues: 整数
- closed_issues: 整数
- state: 字符串
- created_at: 时间戳
- updated_at: 时间戳
- due_on: 空
- closed_at: 空
- comments: 字符串序列
- created_at: 时间戳
- updated_at: 时间戳
- closed_at: 时间戳
- author_association: 字符串
- active_lock_reason: 空
- draft: 布尔值
- pull_request: 结构体
- url: 字符串
- html_url: 字符串
- diff_url: 字符串
- patch_url: 字符串
- merged_at: 时间戳
- body: 字符串
- reactions: 结构体
- url: 字符串
- total_count: 整数
- +1: 整数
- -1: 整数
- laugh: 整数
- hooray: 整数
- confused: 整数
- heart: 整数
- rocket: 整数
- eyes: 整数
- timeline_url: 字符串
- performed_via_github_app: 空
- state_reason: 字符串
- is_pull_request: 布尔值
数据分割
- train: 2626101.12 字节,192 个样本
- valid: 656525.28 字节,48 个样本
- test: 820656.6 字节,60 个样本
数据集创建
策划理由
[需要更多信息]
源数据
初始数据收集和规范化
[需要更多信息]
源语言生产者
[需要更多信息]
注释
注释过程
[需要更多信息]
注释者
[需要更多信息]
个人和敏感信息
[需要更多信息]
使用数据的注意事项
数据集的社会影响
[需要更多信息]
偏见的讨论
[需要更多信息]
其他已知限制
[需要更多信息]
附加信息
数据集策展人
[需要更多信息]
许可信息
[需要更多信息]
引用信息
[需要更多信息]



