insub/Code_Infilling_C_Cpp
收藏Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/insub/Code_Infilling_C_Cpp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是嵌入式C/C++软件中使用的代码集合。该数据集的目的是代码填充,但也可以用于其他用途。数据集收集了来自7个库的代码,包括fprime、boost-asio、TinyXML、inifile-cpp、RTI-DDS、OneAPI和PROJ。文件扩展名和仓库文件数量也进行了统计,并提供了每个仓库的许可证信息。
该数据集是嵌入式C/C++软件中使用的代码集合。该数据集的目的是代码填充,但也可以用于其他用途。数据集收集了来自7个库的代码,包括fprime、boost-asio、TinyXML、inifile-cpp、RTI-DDS、OneAPI和PROJ。文件扩展名和仓库文件数量也进行了统计,并提供了每个仓库的许可证信息。
提供机构:
insub
原始信息汇总
数据集概述
数据集信息
- 特征:
repo_name: 仓库名称,类型为字符串。file_path: 文件路径,类型为字符串。content: 内容,类型为字符串。extention: 文件扩展名,类型为字符串。
- 分割:
train: 训练集,包含95,097,104字节,10,208个样本。
- 下载大小: 22,080,484字节
- 数据集大小: 95,097,104字节
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集内容
-
文件扩展名统计:
扩展名 数量 c 199 cpp 2495 cxx 505 h 5015 hpp 1994 -
仓库文件统计:
仓库名称 文件数量 PROJ 306 asio 1150 fprime 1091 inifile-cpp 8 oneAPI-samples 2456 rticonnextdds-examples 778 rticonnextdds-getting-started 33 rticonnextdds-robot-helpers 53 rticonnextdds-usecases 4329 tinyxml2 4 -
许可证信息:
仓库名称 许可证 PROJ MIT asio boost license fprime Apache-2.0 inifile-cpp MIT oneAPI-samples MIT rticonnextdds-examples rti license rticonnextdds-getting-started rti license rticonnextdds-robot-helpers rti license rticonnextdds-usecases rti license tinyxml2 Zlib -
数据生成脚本:
data_generate.py



