sayakpaul/hf-codegen-v2
收藏Hugging Face2023-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sayakpaul/hf-codegen-v2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: index
dtype: int64
- name: repo_id
dtype: string
- name: file_path
dtype: string
- name: content
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 51358178715
num_examples: 370000
download_size: 11423577734
dataset_size: 51358178715
---
# Dataset Card for "hf-codegen-v2"
Dataset generated with the code from: https://github.com/sayakpaul/hf-codegen.
提供机构:
sayakpaul
原始信息汇总
数据集概述
数据集特征
- index:索引,数据类型为
int64。 - repo_id:仓库ID,数据类型为
string。 - file_path:文件路径,数据类型为
string。 - content:内容,数据类型为
string。 - index_level_0:索引级别0,数据类型为
int64。
数据集划分
- train:训练集,包含
370000个样本,总字节数为51358178715。
数据集大小
- 下载大小:
11423577734字节。 - 数据集大小:
51358178715字节。



