five

multilingual-code-comments-fixed-6

收藏
Hugging Face2026-03-15 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/AISE-TUDelft/multilingual-code-comments-fixed-6
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含五种语言(中文、荷兰语、英语、希腊语、波兰语)的代码相关数据,每个语言配置包含500个训练样本。主要特征包括文件ID、代码内容、代码仓库信息、文件路径、原始注释,以及来自Qwen/CodeQwen1.5-7B、bigcode/starcoder2-7b、ibm-granite/granite-8b-code-base、meta-llama/CodeLlama-7b-hf和google/codegemma-7b等多个AI模型的掩码数据、预测结果和预测注释。此外,还包含专家对各模型预测准确性的评估结果和错误代码。数据集适用于代码生成、代码注释预测等自然语言处理任务的模型评估和比较研究。
提供机构:
AISE research lab at TU Delft
创建时间:
2026-03-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作