five

insub/Code_Infilling_C_Cpp

收藏
Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/insub/Code_Infilling_C_Cpp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是嵌入式C/C++软件中使用的代码集合。该数据集的目的是代码填充,但也可以用于其他用途。数据集收集了来自7个库的代码,包括fprime、boost-asio、TinyXML、inifile-cpp、RTI-DDS、OneAPI和PROJ。文件扩展名和仓库文件数量也进行了统计,并提供了每个仓库的许可证信息。

该数据集是嵌入式C/C++软件中使用的代码集合。该数据集的目的是代码填充,但也可以用于其他用途。数据集收集了来自7个库的代码,包括fprime、boost-asio、TinyXML、inifile-cpp、RTI-DDS、OneAPI和PROJ。文件扩展名和仓库文件数量也进行了统计,并提供了每个仓库的许可证信息。
提供机构:
insub
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • repo_name: 仓库名称,类型为字符串。
    • file_path: 文件路径,类型为字符串。
    • content: 内容,类型为字符串。
    • extention: 文件扩展名,类型为字符串。
  • 分割:
    • train: 训练集,包含95,097,104字节,10,208个样本。
  • 下载大小: 22,080,484字节
  • 数据集大小: 95,097,104字节

配置

  • 默认配置:
    • 数据文件路径: data/train-*

数据集内容

  • 文件扩展名统计:

    扩展名 数量
    c 199
    cpp 2495
    cxx 505
    h 5015
    hpp 1994
  • 仓库文件统计:

    仓库名称 文件数量
    PROJ 306
    asio 1150
    fprime 1091
    inifile-cpp 8
    oneAPI-samples 2456
    rticonnextdds-examples 778
    rticonnextdds-getting-started 33
    rticonnextdds-robot-helpers 53
    rticonnextdds-usecases 4329
    tinyxml2 4
  • 许可证信息:

    仓库名称 许可证
    PROJ MIT
    asio boost license
    fprime Apache-2.0
    inifile-cpp MIT
    oneAPI-samples MIT
    rticonnextdds-examples rti license
    rticonnextdds-getting-started rti license
    rticonnextdds-robot-helpers rti license
    rticonnextdds-usecases rti license
    tinyxml2 Zlib
  • 数据生成脚本: data_generate.py

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作