lewtun/github-issues
收藏Hugging Face2021-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lewtun/github-issues
下载链接
链接失效反馈官方服务:
资源简介:
GitHub Issues数据集由与🤗 Datasets仓库相关的GitHub问题和拉取请求组成,适用于教育目的,可用于语义搜索或多标签文本分类。数据集中的内容为英文,涉及NLP、计算机视觉等领域的数据集。
提供机构:
lewtun
原始信息汇总
数据集概述
数据集名称
GitHub Issues
数据集描述
GitHub Issues 是一个包含与 🤗 Datasets 仓库相关的 GitHub 问题和拉取请求的数据集。该数据集主要用于教育目的,适用于语义搜索或多标签文本分类任务。数据集中的内容均为英文,涉及自然语言处理、计算机视觉等领域的数据集讨论。
支持的任务和排行榜
- 任务描述:该数据集可用于训练模型执行特定任务,如[任务名称],该任务涉及[任务描述]。任务的成功通常通过达到[高/低]的[度量名称]来衡量。
- 推荐模型:模型名称或模型类别模型目前达到以下分数。
- 排行榜:如果存在活跃的排行榜,可在排行榜URL上找到,该排行榜根据度量名称对模型进行排名,并报告其他度量名称。
语言信息
- 语言:英语
- 描述:数据集中的文本内容涉及自然语言处理和计算机视觉等技术领域。
数据集结构
数据实例
- 示例:{ example_field: ..., ... }
- 描述:提供了一个典型的数据集实例的JSON格式示例。
数据字段
example_field: 描述example_field的详细信息。
数据分割
- 描述:如果数据集包含多个分割,将描述这些分割及其分割标准。
- 大小:提供每个分割的大小。
数据集创建
来源数据
- 初始数据收集和标准化:描述数据收集过程和任何数据选择或过滤的标准。
- 数据来源:如果数据来自其他预先存在的数据集,提供源链接及其Hugging Face版本。
注释
- 注释过程:描述注释过程和使用的工具。
- 注释者:描述注释者的信息和选择标准。
个人和敏感信息
- 描述:说明数据集是否使用身份类别,以及如何使用这些信息。
- 敏感信息:说明数据集是否包含其他可能被视为敏感的数据。
使用数据的考虑
社会影响
- 描述:讨论使用此数据集可能对社会产生的影响,包括正面和负面影响。
偏见讨论
- 描述:提供数据中可能存在的特定偏见描述,并说明是否采取了减少这些偏见影响的措施。
其他已知限制
- 描述:如果数据集有其他已知的限制,如注释工件,请在此概述并引用相关研究。
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集名为'lewtun/github-issues',主要收集了与HuggingFace Datasets仓库相关的GitHub问题和拉取请求数据,格式为JSON,包含3,019条记录,总大小为12.3 MB。数据集适用于语义搜索和多标签文本分类等任务,旨在为教育目的提供支持。
以上内容由遇见数据集搜集并总结生成



