EWMBench
收藏EWMBench数据集概述
数据集简介
- 名称:EWMBench (Embodied World Model Benchmark)
- 目的:评估具身世界模型(EWMs)在文本驱动视频生成任务中的表现
- 核心评估维度:
- 视觉场景一致性
- 运动正确性
- 语义对齐
- 特点:
- 关注生成内容在具身环境中的物理合理性和任务连贯性
- 提供多维评估工具包和高质量多样化数据集
数据集结构
真实数据(gt_dataset)
gt_dataset/ ├── task_{n}/ │ ├── episode_{n}/ │ │ ├── prompt/ │ │ │ ├── init_frame.png │ │ │ └── introduction.txt │ │ └── video/ │ │ ├── frame_00000.jpg │ │ ├── ... │ │ └── frame_0000n.jpg
生成样本({xxx}_dataset)
{xxx}dataset/ ├── task{n}/ │ ├── episode_{n}/ │ │ ├── {n}/ │ │ │ └── video/ │ │ │ ├── frame_00000.jpg │ │ │ ├── ... │ │ │ └── frame_0000n.jpg
获取方式
- 下载地址:https://huggingface.co/datasets/agibot-world/EWMBench
- 预训练权重:
- Qwen2.5模型:https://huggingface.co/Qwen/Qwen2.5-VL-7B-Instruct
- CLIP模型:
- https://huggingface.co/openai/clip-vit-base-patch16
- https://openaipublic.azureedge.net/clip/models/40d365715913c9da98579312b702a82c18be219cc2a73407c4526f58eba950af/ViT-B-32.pt
- 微调模型:https://huggingface.co/agibot-world/EWMBench-model
评估方法
-
可用评估维度:
- diversity
- scene_consistency
- trajectory_consistency
- semantics
-
评估命令:
python evaluate.py --dimension semantics trajectory_consistency --config ./config.yaml
引用信息
bib @article{hu2025ewmbench, title={EWMBench: Evaluating Scene, Motion, and Semantic Quality in Embodied World Models}, author={Hu, Yue and Huang, Siyuan and Liao, Yue and Chen, Shengcong and Zhou, Pengfei and Chen, Liliang and Yao, Maoqing and Ren, Guanghui}, journal={arXiv preprint arXiv:2505.09694}, year={2025} }
许可协议
- 许可证类型:CC BY-NC-SA 4.0
- 许可证链接:https://creativecommons.org/licenses/by-nc-sa/4.0/




