MM-WebGen-Bench
收藏MM-WebGen-Bench 数据集概述
基本信息
- 数据集名称:MM-WebGen-Bench
- 创建者/发布者:microsoft
- 语言:英语 (en)
- 许可证:MIT License
- 任务类别:文本生成 (text-generation)
- 标签:benchmark, webpage-generation, multimodal, agent
- 数据集规模:小于1K样本 (n<1K)
- 数据分割:测试集 (test),包含120个样本
数据集描述
MM-WebGen-Bench是一个用于多模态网页生成的多层次评估基准。该数据集包含120个精心策划的网页设计提示,覆盖11个场景类别、11种视觉风格以及多样化的多模态组合(4种视频类型、8种图像类型和17种图表类型)。该基准在MM-WebAgent项目中提出。
数据模式
数据集包含以下字段:
| 字段名 | 数据类型 | 描述 |
|---|---|---|
instruction |
string | 提供给生成模型的任务指令 |
input |
string | 描述布局、风格和内容的详细网页设计提示 |
file_id |
string | 唯一案例标识符 |
相关资源链接
- 项目主页:https://aka.ms/mm-webagent
- GitHub仓库:https://github.com/microsoft/MM-webagent
- 论文:https://arxiv.org/abs/2604.15309
使用方式
可以通过Hugging Face datasets库加载数据集:
python
from datasets import load_dataset
ds = load_dataset("microsoft/MM-WebGen-Bench", split="test")
评估方法
MM-WebAgent提供了一个多层次(全局、图像、视频、图表)的评估流程。具体细节请参考GitHub仓库。
引用信息
如果使用本数据集,请引用以下论文: bibtex @article{li2026mmwebagent, title={MM-WebAgent: A Hierarchical Multimodal Web Agent for Webpage Generation}, author={Yan Li and Zezi Zeng and Yifan Yang and Yuqing Yang and Ning Liao and Weiwei Guo and Lili Qiu and Mingxi Cheng and Qi Dai and Zhendong Wang and Zhengyuan Yang and Xue Yang and Ji Li and Lijuan Wang and Chong Luo}, journal={arXiv preprint arXiv:2604.15309}, year={2026} }
许可证
本数据集采用MIT许可证。




