Code-Vision

arXiv2025-09-30 收录

下载链接：

https://github.com/wanghanbinpanda/CodeVision

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在评估多模态大型语言模型（MLLMs）的逻辑理解和代码生成能力，通过根据给定的流程图生成程序来进行基准测试。该数据集不仅覆盖了基本的编程领域，还挑战了MLLMs在算法和数学问题解决方面的能力。数据集分为三个子集：HumanEval-V、Algorithm和MATH，主要任务是基于流程图表示进行代码生成。

5,000+

优质数据集

54 个

任务类型

进入经典数据集