five

code-philia/mtpnet_tokens

收藏
Hugging Face2025-04-10 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/code-philia/mtpnet_tokens
下载链接
链接失效反馈
官方服务:
资源简介:
包含以下数据集的中文描述:BigCloneBench数据集、POJ-104编程题目数据集、Java代码token序列数据集、包含缺陷标注的C语言代码数据集、代码优化前后对数据集(C语言)、多语言代码-文本对数据集、自然语言-(python)代码对数据集、Web查询-代码对数据集(CodeSearchNet数据集和CoSQA数据集(python))、文本描述-代码(c语言)对数据集、MNIST 数据集。

BigCloneBench dataset, POJ-104 programming questions dataset, Java code token sequence dataset, C language code dataset with defect annotations, code optimization before and after dataset (C language), multi-language code-text pair dataset, natural language-python code pair dataset, Web query-code pair dataset (CodeSearchNet dataset and CoSQA dataset (python)), text description-code (C language) pair dataset, MNIST dataset.
提供机构:
code-philia
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作