MV-Video
收藏MV-Video 数据集
概述
MV-Video 是一个大规模的多视角视频数据集,由 53K 个动画 3D 对象渲染而成。该数据集用于训练 Animate3D: Animating Any 3D Model with Multi-view Video Diffusion。
渲染细节
- 每个对象渲染 16 个视图,均匀分布在方位角上。
- 仰角(
elv)在 0-30 度之间随机采样,起始方位角(azi_start)应用 ±11.25 度的随机偏移。 - 每个视频时长为 2 秒(24 fps)。对于 2-4 秒的动画,渲染前 2 秒;对于超过 4 秒的动画,渲染前 2 秒和后 2 秒。
- 对于超过 6 个动画的对象,随机采样 6 个动画以避免过拟合。
数据结构
数据集包含多个 multi_view_video_*.tar.gz 文件,提取后结构如下:
videos/ ├── [UID1]/ │ ├── 00/ │ │ ├── view_0.mp4 │ │ ├── view_1.mp4 │ │ └── ... │ ├── 01/ │ │ ├── view_0.mp4 │ │ ├── view_1.mp4 │ │ └── ... │ └── ... ├── [UID2]/ │ ├── 00/ │ │ ├── view_0.mp4 │ │ ├── view_1.mp4 │ │ └── ... │ └── ... └── ...
- 提供
uid_info_dict.json文件,包含 3D 对象的元信息。
注意事项
- 数据集中约有 500 个动画模型在数据检查过程中被过滤,因此提供的数据略少于论文中报告的数量。
- 标记了约
7.7K个对象为最高质量,列在high_quality_uid.txt文件中。 - 使用 Minigpt4-video 为多视角视频添加文本提示,部分动画的文本提示可能不准确,建议用户使用高级视频字幕模型重新标注。
许可证
数据集使用 ODC-By v1.0 许可证。渲染对象的许可证如下:
- CC-BY 4.0 - 50,000
- CC-BY-NC 4.0 ~ 1,500
- CC-BY-SA 4.0 ~ 400
- CC-BY-NC-SA 4.0 ~ 400
- CC0 1.0 ~ 100
引用
@article{ jiang2024animate3d, title={Animate3D: Animating Any 3D Model with Multi-view Video Diffusion}, author={Yanqin Jiang and Chaohui Yu and Chenjie Cao and Fan Wang and Weiming Hu and Jin Gao}, booktitle={arXiv}, year={2024}, }




