xvadov01/cpp_emb_nl2pl
收藏Hugging Face2024-05-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/xvadov01/cpp_emb_nl2pl
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如文档字符串、签名、提示、代码、仓库、语言、许可证和星标数。数据集被分割为训练集、验证集和测试集,每个分割都有相应的字节数和示例数。数据集的总下载大小为18976223字节,总大小为35236615字节。数据集的许可证为GPL-3.0。
This dataset includes various programming-related features such as docstring, signature, prompt, code, repository, language, license, and stars. The dataset is divided into train, validation, and test sets, containing 40192, 5024, and 5025 examples respectively. The download size of the dataset is 18976223 bytes, and the actual size is 35236615 bytes. The dataset is licensed under GPL-3.0.
提供机构:
xvadov01
原始信息汇总
数据集概述
数据集特征
- docstring: 数据类型为字符串
- signature: 数据类型为字符串
- prompt: 数据类型为字符串
- code: 数据类型为字符串
- repository: 数据类型为字符串
- language: 数据类型为字符串
- license: 数据类型为字符串
- stars: 数据类型为整数
数据集分割
- 训练集: 大小为28195774字节,包含40192个样本
- 验证集: 大小为3507999字节,包含5024个样本
- 测试集: 大小为3532842字节,包含5025个样本
数据集大小
- 下载大小: 18976223字节
- 数据集总大小: 35236615字节
许可证
- 许可证类型: gpl-3.0



