SynCamVideo Dataset

github2024-12-11 更新2024-12-12 收录

下载链接：

https://github.com/KwaiVGI/SynCamMaster

下载链接

链接失效反馈

官方服务：

资源简介：

SynCamVideo Dataset是一个多摄像头同步视频数据集，使用虚幻引擎5渲染。它包含1000个不同的场景，每个场景由36个摄像头捕捉，共生成36,000个视频。数据集以50种不同的动物作为“主要对象”，并使用来自Poly Haven的20个不同地点作为背景。每个场景中，从50种动物中选择1-2个对象，并沿着预定义的轨迹移动，背景从20个地点中随机选择，36个摄像头同时记录对象的移动。

The SynCamVideo Dataset is a multi-camera synchronized video dataset rendered with Unreal Engine 5. It contains 1,000 distinct scenes, each captured by 36 cameras, yielding a total of 36,000 videos. The dataset takes 50 different animal species as its "primary objects", and adopts 20 distinct locations from Poly Haven as background settings. In each scene, 1 to 2 objects selected from the 50 animal species move along predefined trajectories, the background is randomly picked from the 20 available locations, and the 36 cameras simultaneously record the movement of the objects.

创建时间：

2024-12-06

原始信息汇总

SynCamVideo Dataset

1. 数据集介绍

SynCamVideo Dataset 是一个多摄像头同步视频数据集，使用 Unreal Engine 5 渲染生成。该数据集包含 1,000 个不同的场景，每个场景由 36 个摄像头捕捉，总计 36,000 个视频。数据集的主要特点包括：

主对象：50 种不同的动物。
背景：20 个不同的地点，来自 Poly Haven。
场景设置：每个场景中，1-2 个动物作为主对象，沿着预定义的轨迹移动，背景从 20 个地点中随机选择，36 个摄像头同时记录主对象的移动。

摄像头在每个场景中放置在一个半球形表面上，距离场景中心的距离为 3.5 米至 9 米。为了确保渲染的视频与真实世界视频的域偏移最小，摄像头的仰角限制在 0° 至 45° 之间，方位角限制在 0° 至 360° 之间。每个摄像头的位置在这些约束内随机采样，而不是在所有场景中使用相同的摄像头位置集。

2. 文件结构

SynCamVideo ├── train │ ├── videos # 训练视频 │ │ ├── scene1 # 一个场景 │ │ │ ├── xxx.mp4 # 同步的 100 帧视频，分辨率为 480x720 │ │ │ └── ... │ │ │ ... │ │ └── scene1000 │ │ ├── xxx.mp4 │ │ └── ... │ └── cameras # 训练摄像头 │ ├── scene1 # 一个场景 │ │ └── xxx.json # 与视频对应的相机外参 │ │ ... │ └── scene1000 │ └── xxx.json └── val └── cameras # 验证摄像头 ├── Hemi36_4m_0 # 距离=4m, 仰角=0° │ └── Hemi36_4m_0.json # 36 个摄像头：距离=4m, 仰角=0°, 方位角=i * 10° │ ... └── Hemi36_7m_45 └── Hemi36_7m_45.json

3. 有用的脚本

摄像头可视化 bash python vis_cam.py --pose_file_path ./val/cameras/Hemi36_4m_0/Hemi36_4m_0_transforms.json --num_cameras 36

该可视化脚本修改自 CameraCtrl。

4. 数据集用途

SynCamVideo Dataset 可用于训练多摄像头同步视频生成模型，适用于电影制作和多视图数据生成的下游任务。

搜集汇总

数据集介绍

构建方式

SynCamVideo数据集通过使用虚幻引擎5（Unreal Engine 5）渲染生成，构建了一个多相机同步视频数据集。该数据集包含1,000个不同的场景，每个场景由36个相机同时记录，总计36,000个视频。每个场景中，1-2个来自50种不同动物的“主要对象”沿着预定义的轨迹移动，背景则随机从20个不同的地点中选择。相机被放置在一个半球形表面上，距离场景中心的距离在3.5米至9米之间，确保渲染视频与真实世界视频的领域偏移最小化。

特点

SynCamVideo数据集的显著特点在于其多相机同步记录的特性，每个场景中的36个相机从不同视角捕捉同一对象的运动，提供了丰富的多视角数据。此外，数据集中的相机位置随机采样，避免了场景间的相机位置重复，增强了数据的多样性。数据集还包含了50种不同的动物和20个不同的背景，进一步丰富了场景的多样性，适用于多相机同步视频生成模型的训练。

使用方法

SynCamVideo数据集可用于训练多相机同步视频生成模型，特别适用于电影制作和多视角数据生成的下游任务。用户可以通过下载数据集并按照提供的文件结构进行数据加载和处理。数据集提供了训练和验证集，用户可以根据需要使用不同的场景和相机参数进行模型训练。此外，数据集还提供了相机可视化脚本，帮助用户更好地理解和利用相机参数。

背景与挑战

背景概述

SynCamVideo Dataset是由浙江大学、快手科技、清华大学和香港中文大学的研究人员共同创建的多相机同步视频数据集。该数据集于2024年发布，旨在推动多视角视频生成技术的发展。通过使用虚幻引擎5渲染，SynCamVideo Dataset包含了1000个不同的场景，每个场景由36个相机从不同视角同步捕捉，总计36,000个视频。数据集特别关注50种不同的动物作为主要对象，并结合20个不同的背景环境，模拟了复杂的自然场景。该数据集的创建不仅为电影制作和多视角数据生成提供了丰富的资源，还为下游任务如视频生成模型的训练提供了宝贵的数据支持。

当前挑战

SynCamVideo Dataset在构建过程中面临了多重挑战。首先，多相机同步捕捉技术要求高精度的时序控制和设备校准，以确保每个相机捕捉到的视频帧能够精确对齐。其次，虚幻引擎5的渲染技术虽然强大，但在生成大规模、多样化的场景时，仍需克服计算资源和渲染时间的限制。此外，数据集的多样性和复杂性要求在对象运动轨迹、相机位置和背景选择上进行精细的控制和随机化，以确保生成的视频具有广泛的适用性和代表性。这些挑战不仅推动了数据集构建技术的发展，也为未来的多视角视频生成研究提供了新的方向。

常用场景

经典使用场景

SynCamVideo数据集的经典使用场景主要集中在多摄像头同步视频生成模型的训练与验证。该数据集通过模拟多种视角和场景，为研究者提供了一个丰富的实验平台，用于开发和测试多视角视频生成算法。其核心应用包括电影制作中的多视角拍摄、虚拟现实中的多视角渲染，以及自动驾驶中的多摄像头数据同步等。

解决学术问题

SynCamVideo数据集解决了多摄像头同步视频生成中的关键学术问题，如视角多样性、场景一致性和时间同步性。通过提供高质量的多视角视频数据，该数据集为研究者提供了一个标准化的测试平台，推动了多摄像头视频生成技术的发展，特别是在视角转换和多视角一致性方面的研究。

衍生相关工作

SynCamVideo数据集的发布激发了许多相关研究工作，特别是在多视角视频生成和同步技术领域。例如，基于该数据集的研究工作包括多视角一致性算法、视角转换技术以及多摄像头同步拍摄系统的设计与优化。此外，该数据集还为其他领域的研究提供了基础，如虚拟现实中的多视角渲染和自动驾驶中的多摄像头感知系统。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集