code-philia/mtpnet_tokens
收藏Hugging Face2025-04-10 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/code-philia/mtpnet_tokens
下载链接
链接失效反馈官方服务:
资源简介:
包含以下数据集的中文描述:BigCloneBench数据集、POJ-104编程题目数据集、Java代码token序列数据集、包含缺陷标注的C语言代码数据集、代码优化前后对数据集(C语言)、多语言代码-文本对数据集、自然语言-(python)代码对数据集、Web查询-代码对数据集(CodeSearchNet数据集和CoSQA数据集(python))、文本描述-代码(c语言)对数据集、MNIST 数据集。
BigCloneBench dataset, POJ-104 programming questions dataset, Java code token sequence dataset, C language code dataset with defect annotations, code optimization before and after dataset (C language), multi-language code-text pair dataset, natural language-python code pair dataset, Web query-code pair dataset (CodeSearchNet dataset and CoSQA dataset (python)), text description-code (C language) pair dataset, MNIST dataset.
提供机构:
code-philia



