MMGenBench
收藏MMGenBench: 数据集概述
数据集简介
MMGenBench 是一个用于评估大型多模态模型(LMMs)从文本到图像生成能力的数据集。该数据集旨在通过自动化评估管道,比较原始图像与生成的图像,从而评估 LMMs 在图像生成方面的性能。
数据集结构
- MMGenBench-Test: 包含13种不同的图像模式,用于评估 LMMs 在生成图像领域的性能。
- MMGenBench-Domain: 专注于评估 LMMs 在生成图像领域的性能。
数据文件
数据集包含以下文件:
MMGenBench-Domain.jsonMMGenBench-Domain.tsvMMGenBench-Test-label-count.jsonMMGenBench-Test-label-index.jsonMMGenBench-Test.jsonMMGenBench-Test.tsvREADME.mdcheck.py
使用方法
环境安装
-
克隆仓库: bash git clone git@github.com:lerogo/MMGenBench.git cd MMGenBench
-
下载数据集: bash huggingface-cli download --repo-type dataset lerogo/MMGenBench --local-dir MMGenBench-data
-
安装相关环境,包括
torch,transformers,diffusers和unicom。
评估流程
- 阶段1: 在 VLMEvalKit 中适配模型并进行推理。
- 阶段2: 使用文本到图像生成模型处理 LMMs 的输出。
- 阶段3: 使用
unicom模型提取特征并计算指标。
可视化
运行以下命令进行可视化: bash cd visual bash run.sh
引用
如果使用 MMGenBench 或相关代码,请引用以下文献: bibtex @misc{huang2024MMGenBench, title={MMGenBench: Evaluating the Limits of LMMs from the Text-to-Image Generation Perspective}, author={Hailang Huang and Yong Wang and Zixuan Huang and Huaqiu Li and Tongwen Huang and Xiangxiang Chu and Richong Zhang}, year={2024}, eprint={2411.14062}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.14062}, }




