bloomsirenix/codesupercharge-nogpl
收藏Hugging Face2024-06-30 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/bloomsirenix/codesupercharge-nogpl
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,包括文件名、文件路径、相对路径、语言、类型、描述和内容。数据集主要用于存储和提供各种文件的信息和内容,可能用于自然语言处理或文件管理相关的任务。数据集分为训练集,包含23758个样本,总大小为960289394字节。
This dataset includes multiple fields such as filename, filepath, relative path, language, type, description, and content. It is primarily used for storing and providing information and content of various files, potentially for tasks related to natural language processing or file management. The dataset is divided into a training set containing 23758 samples, with a total size of 960289394 bytes.
提供机构:
bloomsirenix
原始信息汇总
数据集概述
数据集信息
特征
- filename: 文件名,类型为字符串。
- filepath: 文件路径,类型为字符串。
- relative_path: 相对路径,类型为字符串。
- language: 语言,类型为字符串。
- lsl_type: LSL类型,类型为字符串。
- description: 描述,类型为字符串。
- content: 内容,类型为字符串。
数据分割
- train: 训练集,包含23758个样本,总大小为960289394字节。
数据集大小
- 下载大小: 571806747字节
- 数据集总大小: 960289394字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



