RealCam-Vid Dataset
收藏RealCam-Vid Dataset
数据集简介
RealCam-Vid 数据集旨在解决当前相机运动和场景动态数据集存在的局限性,提供了一个结合了多样化场景动态和绝对尺度相机轨迹的独特数据集,使得生成模型能够在统一的框架下学习场景动态和相机运动。
数据集特点
- 多样化场景动态与绝对尺度相机轨迹:数据集结合了丰富的场景动态和相机运动信息。
- 高质量的相机轨迹标注:使用 MonST3R 方法为动态场景视频提供高质量的相机轨迹标注。
- 绝对场景尺度对齐:确保不同来源的数据集在物理尺度上的一致性。
数据源
- DL3DV-10K:包含不同类型的室内和室外场景。
- MiraData:包含游戏渲染、体育、FPV 无人机和城市探索等场景。
- RealEstate10K:包含房地产相关的场景。
伦理关注
所有 RealCam-Vid 数据集中的视频均来源于公共领域,仅用于信息参考。版权归视频原作者所有。如有任何疑虑,请联系 guangcongzheng@zju.edu.cn。
相关项目
引用
@article{li2025realcam, title={RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control}, author={Li, Teng and Zheng, Guangcong and Jiang, Rui and Zhan, Shuigen and Wu, Tao and Lu, Yehao and Lin, Yining and Li, Xi}, journal={arXiv preprint arXiv:2502.10059}, year={2025}, }
@article{zheng2024cami2v, title={CamI2V: Camera-Controlled Image-to-Video Diffusion Model}, author={Zheng, Guangcong and Li, Teng and Jiang, Rui and Lu, Yehao and Wu, Tao and Li, Xi}, journal={arXiv preprint arXiv:2410.15957}, year={2024} }




