Move360

Hugging Face2026-02-13 更新2026-02-14 收录

下载链接：

https://huggingface.co/datasets/VegQi/Move360

下载链接

链接失效反馈

官方服务：

资源简介：

VegQi/Move360 是一个高质量的全景（360°）视频数据集，分辨率为7680×3840，帧率为30 fps。数据集以表格形式组织，每条记录对应一个图像帧或图像实例，包含以下字段：`scene_id`（场景/片段标识符，如'0001'）、`frame_id`（帧标识符，从文件名提取，如'00000001'）、`relpath`（原始相对路径，如'0001/00000001.jpg'）和`image`（存储为`datasets.Image`特征的图像内容，可直接解码为PIL图像对象）。数据集规模在1万到10万样本之间，适用于3D、全景视频、全景图像和全向视觉相关的研究与应用。数据集使用Apache-2.0许可证，并附有相关论文引用信息。

创建时间：

2026-02-11

原始信息汇总

VegQi/Move360 数据集概述

数据集基本信息

数据集名称: VegQi/Move360
许可协议: Apache-2.0
数据规模: 10K<n<100K
相关标签: 3D, 360Video, 360Image, Omnidirectional, 360

数据集描述

这是一个高质量的360°视频数据集，分辨率为7680×3840，帧率为30 fps。

数据结构与模式

数据集以表格结构表示，每一行对应一个单独的图像帧（或一个单独的图像实例）。包含以下字段：

scene_id: 场景/片段剪辑的标识符（例如 "0001"）。
frame_id: 帧的标识符，源自不带扩展名的文件名主干（例如 "00000001"）。
relpath: 原始相对路径，遵循原始目录结构（例如 "0001/00000001.jpg"）。
image: 图像内容，存储为 datasets.Image 特征；访问时可直接解码为PIL图像对象。

快速开始

安装依赖

bash pip install -U datasets pillow

加载数据集

python from datasets import load_dataset ds = load_dataset("VegQi/Move360", split="train") print(ds) print(ds.features)

访问样本与解码图像

python sample = ds[0] scene_id = sample["scene_id"] frame_id = sample["frame_id"] relpath = sample["relpath"] img = sample["image"] # PIL.Image.Image print(scene_id, frame_id, relpath, img.size)

引用

如果在研究或工作中使用此数据集，请引用以下论文：

@article{li2025omnidrag, title={OmniDrag: Enabling Motion Control for Omnidirectional Image-to-Video Generation}, author={Li, Weiqi and Zhao, Shijie and Mou, Chong and Sheng, Xuhan and Zhang, Zhenyu and Wang, Qian and Li, Junlin and Zhang, Li and Zhang, Jian}, journal={International Journal of Computer Vision (IJCV)}, year={2025} }

搜集汇总

数据集介绍

构建方式

在沉浸式视觉技术蓬勃发展的背景下，Move360数据集的构建旨在为全景视频研究提供高质量资源。该数据集以7680×3840的超高分辨率和每秒30帧的速率，系统性地采集了真实世界的360度视频片段。每个数据样本对应一个独立的图像帧，并通过结构化的表格形式进行组织，包含场景标识、帧序列号、原始路径以及可直接解码为PIL图像对象的图像数据字段，确保了数据的完整性与可追溯性。

特点

Move360数据集的核心特征在于其卓越的视觉保真度与规范的元数据结构。作为专为全景视觉任务设计的高质量资源，它提供了8K级别的等矩形投影图像，为模型训练提供了丰富的细节信息。数据集采用清晰的字段划分，如`scene_id`和`frame_id`，便于研究者按场景或时间序列进行精准的数据切片与分析。这种高分辨率与结构化元数据的结合，使其特别适用于需要精细运动理解和空间感知的计算机视觉应用。

使用方法

为便于学术研究与工程开发，Move360数据集通过Hugging Face的`datasets`库提供了便捷的访问接口。用户仅需安装必要的Python依赖，即可通过简单的加载命令获取整个数据集。数据以特征字典的形式呈现，其中的图像字段可直接作为PIL对象进行操作，极大简化了数据预处理流程。研究者能够快速访问样本的元信息与像素内容，从而将精力集中于全景视频生成、运动分析等核心算法的探索与验证。

背景与挑战

背景概述

随着虚拟现实与增强现实技术的蓬勃发展，高分辨率全景视频数据成为推动沉浸式视觉体验与三维场景理解研究的关键资源。Move360数据集由研究团队于2025年创建，旨在为全景图像到视频生成领域提供高质量的基准数据。该数据集以7680×3840的超高分辨率与30帧每秒的帧率，捕捉了丰富的动态场景，为核心研究问题——如全景视频中的运动控制与内容生成——提供了坚实的实验基础。其发布不仅促进了OmniDrag等相关算法的发展，也为计算机视觉与图形学领域的全景内容分析注入了新的活力。

当前挑战

在全景视觉领域，如何精确建模与生成动态、连贯的全景视频内容，是当前面临的核心挑战。Move360数据集所针对的全景图像到视频生成任务，需解决球面投影下的运动一致性、视场畸变校正以及高分辨率下的计算效率等难题。在数据构建过程中，采集与处理超高分辨率全景视频流带来了存储与传输的巨大压力，同时确保视频帧间的时间对齐与场景分割的准确性，也对数据标注与质量控制提出了较高要求。这些挑战共同推动了全景视频处理技术向更高效、更逼真的方向发展。

常用场景

经典使用场景

在计算机视觉与多媒体处理领域，全景视频数据因其沉浸式特性而备受关注。Move360数据集以其高分辨率（7680×3840）和30帧每秒的帧率，为全景视频生成与编辑任务提供了高质量的基准资源。该数据集最经典的使用场景在于支持全景图像到视频的生成研究，特别是针对运动控制算法的开发与评估。研究者能够利用其丰富的场景标识与帧序列，构建端到端的生成模型，探索如何在360度视域中实现自然、连贯的动态内容合成，从而推动沉浸式媒体技术的创新。

实际应用

在实际应用层面，Move360数据集为沉浸式媒体产业提供了重要的技术支持。它可广泛应用于虚拟现实（VR）内容创作、360度视频编辑工具开发以及交互式全景体验系统构建。例如，在VR影视制作中，基于该数据集的生成模型能够辅助创作者快速合成高质量的全景动态场景，降低制作成本并提升效率。此外，在教育培训、远程协作和数字孪生等领域，其衍生的技术也有助于实现更真实、互动的视觉呈现，推动沉浸式应用向更广泛行业渗透。

衍生相关工作

围绕Move360数据集，已衍生出多项经典研究工作，其中最具代表性的是OmniDrag框架。该工作专注于全景图像到视频生成中的运动控制问题，利用数据集的高质量帧序列，提出了针对全方位视角的动态内容编辑方法。此外，基于该数据集的后续研究还拓展至全景视频超分辨率、时空去噪以及多视角合成等方向，为全景视觉处理领域贡献了一系列创新算法与模型。这些工作不仅验证了数据集的实用价值，也进一步丰富了全景多媒体技术的理论体系与应用生态。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集