MME-Unify
收藏MME-Unify数据集概述
数据集简介
- 名称:MME-Unify
- 类型:多模态理解与生成模型评估基准
- 目的:系统评估统一多模态大语言模型(U-MLLMs)的能力
- 特点:
- 包含标准化传统任务评估和统一任务评估
- 涵盖12个数据集、10个任务、30个子任务
- 引入5个新颖的多模态推理任务
数据集内容
-
任务类型:
- 图像编辑
- 常识问答与图像生成
- 几何推理
- 条件图像到视频生成
- 细粒度图像重建
- 数学推理
- 多图像与文本交错
- 单图像感知与理解
- 找不同
- 文本-图像编辑
- 文本-图像生成
- 文本到视频生成
- 视频感知与理解
- 视觉思维链
-
数据结构:
MME-Unify ├── CommonSense_Questions ├── Conditional_Image_to_Video_Generation ├── Fine-Grained_Image_Reconstruction ├── Math_Reasoning ├── Multiple_Images_and_Text_Interlaced ├── Single_Image_Perception_and_Understanding ├── Spot_Diff ├── Text-Image_Editing ├── Text-Image_Generation ├── Text-to-Video_Generation ├── Video_Perception_and_Understanding └── Visual_CoT
评估流程
- 提示模板:
MME-Unify/Prompt.txt - 评估脚本:
MME-Unify/evaluate - 响应格式:JSON模板(
output_test_template.json)
许可证
- 用途限制:仅限学术研究
- 商业使用:禁止
- 版权声明:图像版权归原作者所有
- 分发限制:未经事先批准不得分发、发布、复制、传播或修改
引用信息
bibtex @article{xie2025mme, title={MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models}, author={Xie, Wulin and Zhang, Yi-Fan and Fu, Chaoyou and Shi, Yang and Nie, Bingyan and Chen, Hongkai and Zhang, Zhang and Wang, Liang and Tan, Tieniu}, journal={arXiv preprint arXiv:2504.03641}, year={2025} }
相关资源
- 数据集下载:https://huggingface.co/datasets/wulin222/MME-Unify
- 论文链接:https://arxiv.org/abs/2504.03641
- 项目主页:https://mme-unify.github.io/




