Multi-Expr Dataset
收藏FantasyPortrait数据集概述
数据集基本信息
- 项目名称: FantasyPortrait
- 核心功能: 通过Expression-Augmented Diffusion Transformers增强多角色肖像动画
- 发布日期: 2025年8月12日
- 相关资源:
- 论文: arXiv:2507.12956
- 项目主页: FantasyPortrait
- 模型仓库: HuggingFace | ModelScope
- 数据集仓库: HuggingFace | ModelScope
数据集特点
- 首个公开的多肖像面部表情视频数据集 (Multi-Expr Dataset)
- 支持单人/多人肖像动画生成
- 包含动物角色动画示例
技术指标
- 基础模型: Wan2.1-I2V-14B-720P
- 性能基准 (A100单卡):
- torch.bfloat16精度:
- 无参数限制: 15.5s/it, 40G显存
- 7B参数限制: 32.8s/it, 20G显存
- 0参数限制: 42.6s/it, 5G显存
- torch.bfloat16精度:
使用方式
快速开始
-
环境安装: sh git clone https://github.com/Fantasy-AMAP/fantasy-portrait.git cd fantasy-portrait apt-get install ffmpeg pip install -r requirements.txt flash_attn
-
模型下载: sh
HuggingFace方式
huggingface-cli download Wan-AI/Wan2.1-I2V-14B-720P --local-dir ./models/Wan2.1-I2V-14B-720P huggingface-cli download acvlab/FantasyPortrait --local-dir ./models
ModelScope方式
modelscope download Wan-AI/Wan2.1-I2V-14B-720P --local_dir ./models/Wan2.1-I2V-14B-720P modelscope download amap_cvlab/FantasyPortrait --local_dir ./models
- 推理执行:
- 单人肖像:
bash infer_single.sh - 多人肖像(同驱动视频):
bash infer_multi.sh - 多人肖像(不同驱动视频):
bash infer_multi_diff.sh
引用格式
bibtex @article{wang2025fantasyportrait, title={FantasyPortrait: Enhancing Multi-Character Portrait Animation with Expression-Augmented Diffusion Transformers}, author={Wang, Qiang and Wang, Mengchao and Jiang, Fan and Fan, Yaqi and Qi, Yonggang and Xu, Mu}, journal={arXiv preprint arXiv:2507.12956}, year={2025} }
致谢
- 受惠于Wan2.1
- PD-FGC
- DiffSynth-Studio等开源项目




