multilingual-code-comments-fixed-6
收藏Hugging Face2026-03-15 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/AISE-TUDelft/multilingual-code-comments-fixed-6
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含五种语言(中文、荷兰语、英语、希腊语、波兰语)的代码相关数据,每个语言配置包含500个训练样本。主要特征包括文件ID、代码内容、代码仓库信息、文件路径、原始注释,以及来自Qwen/CodeQwen1.5-7B、bigcode/starcoder2-7b、ibm-granite/granite-8b-code-base、meta-llama/CodeLlama-7b-hf和google/codegemma-7b等多个AI模型的掩码数据、预测结果和预测注释。此外,还包含专家对各模型预测准确性的评估结果和错误代码。数据集适用于代码生成、代码注释预测等自然语言处理任务的模型评估和比较研究。
提供机构:
AISE research lab at TU Delft
创建时间:
2026-03-15



