five

huiyeruzhou/MathVerse-lmmseval

收藏
Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/huiyeruzhou/MathVerse-lmmseval
下载链接
链接失效反馈
官方服务:
资源简介:
MathVerse是一个全面的视觉数学基准测试,旨在公平且深入地评估多模态大语言模型(MLLMs)的能力。该数据集收集了2,612个高质量、多学科的数学问题,并通过人工注释将其转换为六个不同版本,每个版本在多模态信息内容上有所不同,总共生成了15K个测试样本。通过这种方式,MathVerse能够全面评估MLLMs是否以及如何真正理解视觉图表以进行数学推理。此外,还提出了Chain-of-Thought (CoT)评估策略,用于细粒度评估模型的推理过程。
提供机构:
huiyeruzhou
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作