waybarrios/github-code-dataset
收藏Hugging Face2023-06-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/waybarrios/github-code-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: path
dtype: string
- name: content
dtype: string
- name: size
dtype: int64
- name: max_lines
dtype: int64
- name: repo_name
dtype: string
- name: autogenerated
dtype: bool
splits:
- name: train
num_bytes: 152825770
num_examples: 18912
download_size: 57591057
dataset_size: 152825770
---
# Dataset Card for "github-code-dataset"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
waybarrios
原始信息汇总
数据集概述
数据集名称
github-code-dataset
数据集特征
- path:字符串类型
- content:字符串类型
- size:整数类型(int64)
- max_lines:整数类型(int64)
- repo_name:字符串类型
- autogenerated:布尔类型
数据集拆分
- train:
- 示例数量:18912
- 字节数:152825770
数据集大小
- 下载大小:57591057字节
- 数据集大小:152825770字节



