five

MMBench-DEV-RU

收藏
魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/Vikhrmodels/MMBench-DEV-RU
下载链接
链接失效反馈
官方服务:
资源简介:
# MMBench-DEV-RU Это переведенный Dev сплит mmbench для оценки русскоязычных мультимодальных LLM. Перевод происходил при помощи gpt-4, часть вопросов была проверена ассесорами. В данной версии отсутствует малая часть вопросов оригинального бенчмарка. Ссылка на оригинальный бенчмарк: https://huggingface.co/spaces/opencompass/MMBench ## Скрипт для оценки качества https://github.com/Natyren/mmbench-ru-eval Файл, который вы собираетесь прогнать должен включать колонку gt ответа и предсказанного. Они должны называться соответсвенно "answer" и "predict"

# MMBench-DEV-RU 本资源为经翻译后的MMBench开发子集,用于评估俄语多模态大语言模型(Large Language Model,LLM)。翻译工作依托GPT-4完成,部分问题已由评估专员核验。本版本暂未包含原始基准测试的全部问题,缺失少量原始题目。 原始基准测试链接:https://huggingface.co/spaces/opencompass/MMBench ## 质量评估脚本 https://github.com/Natyren/mmbench-ru-eval 待执行评估的文件需包含标准答案列与预测答案列,二者的列名需分别为"answer"与"predict"。
提供机构:
maas
创建时间:
2025-09-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作