MMBench-DEV-RU
收藏魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/Vikhrmodels/MMBench-DEV-RU
下载链接
链接失效反馈官方服务:
资源简介:
# MMBench-DEV-RU
Это переведенный Dev сплит mmbench для оценки русскоязычных мультимодальных LLM.
Перевод происходил при помощи gpt-4, часть вопросов была проверена ассесорами.
В данной версии отсутствует малая часть вопросов оригинального бенчмарка.
Ссылка на оригинальный бенчмарк: https://huggingface.co/spaces/opencompass/MMBench
## Скрипт для оценки качества
https://github.com/Natyren/mmbench-ru-eval
Файл, который вы собираетесь прогнать должен включать колонку gt ответа и предсказанного. Они должны называться соответсвенно "answer" и "predict"
# MMBench-DEV-RU
本资源为经翻译后的MMBench开发子集,用于评估俄语多模态大语言模型(Large Language Model,LLM)。翻译工作依托GPT-4完成,部分问题已由评估专员核验。本版本暂未包含原始基准测试的全部问题,缺失少量原始题目。
原始基准测试链接:https://huggingface.co/spaces/opencompass/MMBench
## 质量评估脚本
https://github.com/Natyren/mmbench-ru-eval
待执行评估的文件需包含标准答案列与预测答案列,二者的列名需分别为"answer"与"predict"。
提供机构:
maas
创建时间:
2025-09-19



