lewtun/github-issues

Name: lewtun/github-issues
Creator: lewtun
Published: 2021-10-04 15:49:55
License: 暂无描述

Hugging Face2021-10-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/lewtun/github-issues

下载链接

链接失效反馈

官方服务：

资源简介：

GitHub Issues数据集由与🤗 Datasets仓库相关的GitHub问题和拉取请求组成，适用于教育目的，可用于语义搜索或多标签文本分类。数据集中的内容为英文，涉及NLP、计算机视觉等领域的数据集。

提供机构：

lewtun

原始信息汇总

数据集概述

数据集名称

GitHub Issues

数据集描述

GitHub Issues 是一个包含与 🤗 Datasets 仓库相关的 GitHub 问题和拉取请求的数据集。该数据集主要用于教育目的，适用于语义搜索或多标签文本分类任务。数据集中的内容均为英文，涉及自然语言处理、计算机视觉等领域的数据集讨论。

支持的任务和排行榜

任务描述：该数据集可用于训练模型执行特定任务，如[任务名称]，该任务涉及[任务描述]。任务的成功通常通过达到[高/低]的[度量名称]来衡量。
推荐模型：模型名称或模型类别模型目前达到以下分数。
排行榜：如果存在活跃的排行榜，可在排行榜URL上找到，该排行榜根据度量名称对模型进行排名，并报告其他度量名称。

语言信息

语言：英语
描述：数据集中的文本内容涉及自然语言处理和计算机视觉等技术领域。

数据集结构

数据实例

示例：{ example_field: ..., ... }
描述：提供了一个典型的数据集实例的JSON格式示例。

数据字段

example_field: 描述example_field的详细信息。

数据分割

描述：如果数据集包含多个分割，将描述这些分割及其分割标准。
大小：提供每个分割的大小。

数据集创建

来源数据

初始数据收集和标准化：描述数据收集过程和任何数据选择或过滤的标准。
数据来源：如果数据来自其他预先存在的数据集，提供源链接及其Hugging Face版本。

注释

注释过程：描述注释过程和使用的工具。
注释者：描述注释者的信息和选择标准。

个人和敏感信息

描述：说明数据集是否使用身份类别，以及如何使用这些信息。
敏感信息：说明数据集是否包含其他可能被视为敏感的数据。

使用数据的考虑

社会影响

描述：讨论使用此数据集可能对社会产生的影响，包括正面和负面影响。

偏见讨论

描述：提供数据中可能存在的特定偏见描述，并说明是否采取了减少这些偏见影响的措施。

其他已知限制

描述：如果数据集有其他已知的限制，如注释工件，请在此概述并引用相关研究。

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集名为'lewtun/github-issues'，主要收集了与HuggingFace Datasets仓库相关的GitHub问题和拉取请求数据，格式为JSON，包含3,019条记录，总大小为12.3 MB。数据集适用于语义搜索和多标签文本分类等任务，旨在为教育目的提供支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集