five

lewtun/github-issues

收藏
Hugging Face2021-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lewtun/github-issues
下载链接
链接失效反馈
官方服务:
资源简介:
GitHub Issues数据集由与🤗 Datasets仓库相关的GitHub问题和拉取请求组成,适用于教育目的,可用于语义搜索或多标签文本分类。数据集中的内容为英文,涉及NLP、计算机视觉等领域的数据集。
提供机构:
lewtun
原始信息汇总

数据集概述

数据集名称

GitHub Issues

数据集描述

GitHub Issues 是一个包含与 🤗 Datasets 仓库相关的 GitHub 问题和拉取请求的数据集。该数据集主要用于教育目的,适用于语义搜索或多标签文本分类任务。数据集中的内容均为英文,涉及自然语言处理、计算机视觉等领域的数据集讨论。

支持的任务和排行榜

  • 任务描述:该数据集可用于训练模型执行特定任务,如[任务名称],该任务涉及[任务描述]。任务的成功通常通过达到[高/低]的[度量名称]来衡量。
  • 推荐模型:模型名称模型类别模型目前达到以下分数。
  • 排行榜:如果存在活跃的排行榜,可在排行榜URL上找到,该排行榜根据度量名称对模型进行排名,并报告其他度量名称

语言信息

  • 语言:英语
  • 描述:数据集中的文本内容涉及自然语言处理和计算机视觉等技术领域。

数据集结构

数据实例
  • 示例:{ example_field: ..., ... }
  • 描述:提供了一个典型的数据集实例的JSON格式示例。
数据字段
  • example_field: 描述example_field的详细信息。
数据分割
  • 描述:如果数据集包含多个分割,将描述这些分割及其分割标准。
  • 大小:提供每个分割的大小。

数据集创建

来源数据
  • 初始数据收集和标准化:描述数据收集过程和任何数据选择或过滤的标准。
  • 数据来源:如果数据来自其他预先存在的数据集,提供源链接及其Hugging Face版本。
注释
  • 注释过程:描述注释过程和使用的工具。
  • 注释者:描述注释者的信息和选择标准。

个人和敏感信息

  • 描述:说明数据集是否使用身份类别,以及如何使用这些信息。
  • 敏感信息:说明数据集是否包含其他可能被视为敏感的数据。

使用数据的考虑

社会影响
  • 描述:讨论使用此数据集可能对社会产生的影响,包括正面和负面影响。
偏见讨论
  • 描述:提供数据中可能存在的特定偏见描述,并说明是否采取了减少这些偏见影响的措施。
其他已知限制
  • 描述:如果数据集有其他已知的限制,如注释工件,请在此概述并引用相关研究。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集名为'lewtun/github-issues',主要收集了与HuggingFace Datasets仓库相关的GitHub问题和拉取请求数据,格式为JSON,包含3,019条记录,总大小为12.3 MB。数据集适用于语义搜索和多标签文本分类等任务,旨在为教育目的提供支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作