five

代码大语言模型多任务评估基准CodeFuseEval

收藏
魔搭社区2026-05-19 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/codefuse-ai/CodeFuseEval
下载链接
链接失效反馈
官方服务:
资源简介:
codefuse-ai系列以及开源大模型(如:MFTCoder\CodeLlama\CodeGeex系列)代码能力评测基准,可用于评估模型在代码生成、跨语言代码翻译、代码优化等多类任务的代码能力,旨在构建贴近企业实际应用大模型代码能力的评测基准。

This code capability evaluation benchmark covers the CodeFuse-AI series and open-source large language models such as MFTCoder, CodeLlama, and CodeGeex series. It can be used to evaluate the code capabilities of models across various tasks including code generation, cross-language code translation, and code optimization, and aims to build a code capability evaluation benchmark for large language models that closely aligns with real-world enterprise applications.
提供机构:
maas
创建时间:
2023-11-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CodeFuseEval是一个用于评估代码大语言模型的多任务基准数据集,专注于代码翻译、代码补全和文本到代码等任务。该数据集基于CC-BY-NC-SA-4.0许可证发布,由codefuse-ai维护,截至2024年9月已获得超过2,000次下载。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务