代码大语言模型多任务评估基准CodeFuseEval

Name: 代码大语言模型多任务评估基准CodeFuseEval
Creator: maas
Published: 2026-05-19 20:46:50
License: 暂无描述

魔搭社区2026-05-19 更新2024-05-15 收录

下载链接：

https://modelscope.cn/datasets/codefuse-ai/CodeFuseEval

下载链接

链接失效反馈

官方服务：

资源简介：

codefuse-ai系列以及开源大模型（如：MFTCoder\CodeLlama\CodeGeex系列）代码能力评测基准，可用于评估模型在代码生成、跨语言代码翻译、代码优化等多类任务的代码能力，旨在构建贴近企业实际应用大模型代码能力的评测基准。

This code capability evaluation benchmark covers the CodeFuse-AI series and open-source large language models such as MFTCoder, CodeLlama, and CodeGeex series. It can be used to evaluate the code capabilities of models across various tasks including code generation, cross-language code translation, and code optimization, and aims to build a code capability evaluation benchmark for large language models that closely aligns with real-world enterprise applications.

提供机构：

maas

创建时间：

2023-11-01

搜集汇总

数据集介绍