MV4DBench

Hugging Face2026-04-28 更新2026-04-29 收录

下载链接：

https://huggingface.co/datasets/SnoopyFan/MV4DBench

下载链接

链接失效反馈

官方服务：

资源简介：

MV4DBench是一个包含31个多视角4D动画网格的基准数据集，用于评估从图像/视频到4D网格重建的方法。每个数据项包括从8个方位角渲染的图像序列（透明背景和白色背景两种版本）、4个方位角的MP4视频、原始动画网格文件、元数据文件以及带有地面实况的追踪点云数据（用于倒角距离评估）。点云数据在16个均匀间隔的源帧索引上采样，并归一化到[-1,1]^3立方体内。数据集中的动画网格来源于精选的3D动画子集（如Mixamo角色、动物/物体扫描等），帧数范围从11到757不等，渲染分辨率为1024×1024，帧率为24 fps。该数据集被用作ActionMesh（Meta, 2024）多视角测试时适应扩展的保留评估集。

MV4DBench is a benchmark dataset comprising 31 multi-view 4D animated meshes, designed to evaluate methods for image/video-to-4D mesh reconstruction. Each data item includes image sequences rendered from 8 azimuth angles (with both transparent and white backgrounds), MP4 videos from 4 azimuth angles, original animated mesh files, metadata files, and tracked point cloud data with ground truth (for Chamfer distance evaluation). The point cloud data is sampled at 16 uniformly spaced source frame indices and normalized to the [-1,1]^3 cube. The animated meshes in the dataset are sourced from a curated subset of 3D animations (e.g., Mixamo characters, animal/object scans, etc.), with frame counts ranging from 11 to 757, rendered at a resolution of 1024×1024 and a frame rate of 24 fps. This dataset serves as the held-out evaluation set for the multi-view test-time adaptation extension in ActionMesh (Meta, 2024).

创建时间：

2026-04-28

原始信息汇总

数据集概述：MV4DBench

MV4DBench 是一个多视角4D动画网格基准测试数据集，旨在评估图像/视频到4D网格重建方法。数据集包含31个高质量动画样本。

数据集规模

样本数量：31个动画GLB模型。
帧数范围：每个样本的帧数从11到757帧不等。
渲染分辨率：1024×1024像素，每秒24帧。

数据来源与内容

来源于精心挑选的3D动画子集，包括Mixamo角色、动物/物体扫描等。
每个样本包含8个方位角（每45度一个）和N个源帧的渲染结果。

数据格式与结构

每个样本（以<uid>标识）的目录结构如下：

source.glb：原始动画网格。
meta.json：相机矩阵、帧数、帧率等元数据。
rgba_8views/：8个方位角的透明背景RGBA图像（PNG格式）。
rgb_8views/：8个方位角的白色背景RGB图像（PNG格式）。
anim_4views/：4个方位角的MP4视频文件。
gt_surfaces.npy：真实跟踪点云数据，形状为(16, 100000, 6)，包含xyz坐标和法线，归一化到[-1,1]^3立方体。

评估指标

使用Chamfer距离进行定量评估，基于提供的真实点云数据。
真实点云在16个均匀分布的源帧索引上采样，并通过重心追踪生成。

额外信息

UID映射：原始UID可能包含空白或|字符，已清理为前导十六进制字符串。uid_mapping.json记录了原始完整名称以便追溯。
渲染设置：相机半径为2.2，仰角为15度。

许可证与标签

许可证：CC-BY-4.0
任务类别：图像到3D（image-to-3d）
标签：4D、多视角、网格、动画、基准测试

搜集汇总

数据集介绍

构建方式

MV4DBench是一个专为评估图像/视频至4D网格重建方法而设计的基准数据集，包含31个精心挑选的动画网格项目。每个项目从8个方位角和N个源帧进行渲染，并提供跟踪的真实点云（T=16, N=100k, xyz+法线）用于倒角距离评估。其构建从Mixamo角色、动物/物体扫描等3D动画中精选而来，帧数范围11至757帧，渲染分辨率为1024×1024，帧率24fps，半径2.2，仰角15°。每个项目以唯一标识符组织，包含原始动画网格、元数据、多视图RGBA和RGB图像、多视角MP4视频以及采样的地面真实点云文件，其中点云通过重心跟踪在静止姿态网格上均匀采样16个源帧索引，并归一化至[-1,1]³立方体，以确保与渲染场景归一化对齐的倒角分数。

使用方法

研究者可将此数据集作为图像到4D网格重建模型的测试基准。在评估时，首先利用提供的多视图渲染图像或视频作为输入，生成预测的4D网格序列。随后，通过计算每个时间步的预测网格与对应地面真实点云之间的倒角距离来衡量重建精度。数据集中的`meta.json`文件提供了相机矩阵、帧数和帧率等元数据，便于对齐渲染视角。对于需要多视角融合或时间一致性优化的方法，可结合所有8个方位视图进行训练或测试时自适应。最终，参照文献中提供的基准数值，开发者可对比自身方法在31个项目上的平均性能，从而推动4D重建领域的发展。

背景与挑战

背景概述

在三维计算机视觉领域，从多视角图像或视频重建动态三维网格（4D重建）是一项极具挑战性的前沿课题，其研究成果对虚拟现实、增强现实及数字内容创作等领域具有深远影响。MV4DBench基准数据集由Meta研究团队于2024年创建，旨在为图像/视频到4D网格重建方法提供标准化的评估平台。该数据集精心挑选了31个动画化的三维网格（GLB格式），涵盖Mixamo角色动画、动物及物体扫描等多种类型，每个样本通过8个方位角和N个源帧进行渲染，并附带经过追踪的真实点云（16帧，每帧10万点，含法线信息），用于计算倒角距离等评估指标。MV4DBench的提出，填补了动态多视角三维重建领域缺乏统一评估基准的空白，显著推动了4D重建方法的性能对比与进步。

当前挑战

MV4DBench数据集所解决的领域核心挑战在于，现有静态三维重建评估指标无法有效衡量动态场景下的时序一致性与几何精度。具体而言，1) 动态网格重建面临运动模糊、纹理变化及拓扑不一致等复杂问题，导致传统单帧重建方法在时序维度表现不佳；2) 该数据集在构建过程中需解决多个技术难点，包括从11到757帧不等、不同复杂度的动画序列的标准化渲染，以及通过重心坐标追踪技术对自由曲面进行精确点云采样，确保在[-1,1]^3归一化空间内倒角距离评分尺度一致；此外，原始数据中存在的空白字符与竖线符号等命名不一致问题，也需经规范化处理以维持数据集的完整可追溯性。

常用场景

经典使用场景

MV4DBench是一个专为多视图4D动态网格重建任务设计的基准数据集，在计算机视觉与图形学交叉领域中扮演着关键角色。该数据集包含31个精心挑选的动画网格对象，涵盖Mixamo角色、动物与物体扫描等多种类别，每个对象均从8个方位角渲染多帧图像及视频。研究者通常利用该数据集评估从图像或视频输入到4D网格输出的重建方法，通过提供的跟踪地面真值点云计算倒角距离，从而量化重建精度。其标准化渲染参数和归一化的点云坐标确保了评估的公平性与可重复性，成为该领域方法对比的权威测试平台。

解决学术问题

MV4DBench针对性地解决了动态三维重建领域长期存在的评估标准缺失问题。此前，缺乏统一、高质量的4D动画基准导致不同方法间难以进行公平比较。该数据集通过提供16帧均匀采样的10万点跟踪点云及多视角渲染数据，使研究者能够系统性地衡量方法在时间一致性、几何保真度和纹理细节保留方面的表现。其重要性在于推动了从静态3D重建向动态4D理解的研究范式转变，为时空建模、非刚性形变分析等前沿方向提供了可靠的评测工具，显著促进了该领域学术研究的规范化与进步。

实际应用

在实际应用中，MV4DBench为驱动虚拟现实、增强现实和数字娱乐产业的技术突破提供了关键支撑。该基准数据集帮助开发人员验证和优化4D内容生成流水线，使游戏角色动画、虚拟化身创建和影视特效制作等场景能够从单目或多目视频中自动重建出高保真度的动态网格。此外，在机器人仿真与自动驾驶领域，该数据集可用于测试对动态物体（如行人、动物）的实时感知与重建能力，赋能更安全、更智能的人机交互系统，其影响正延伸至医疗影像分析中的动态器官建模等前沿领域。

数据集最近研究