SynMirrorV2

Hugging Face2025-07-15 更新2025-07-15 收录

下载链接：

https://huggingface.co/datasets/ankitIIsc/SynMirrorV2

下载链接

链接失效反馈

官方服务：

资源简介：

SynMirrorV2是一个包含207K个样本的大型合成数据集，提供了完整的场景几何信息，包括深度图、法线图和分割掩模。该数据集利用Objaverse和ABO数据集的3D资源，并通过BlenderProc进行了渲染处理。数据集经过了物体定位、旋转等关键增强，并支持场景内多物体的渲染。

创建时间：

2025-07-12

原始信息汇总

SynMirrorV2 数据集概述

数据集基本信息

许可证: MIT
任务类别: 图像到图像
语言: 英语
规模: 小于1K

数据集描述

SynMirrorV2 是一个大规模合成数据集，包含207K样本，具有完整的场景几何信息，包括深度图、法线图和分割掩码。该数据集是论文《MirrorVerse: Pushing Diffusion Models to Realistically Reflect the World》（CVPR25）的数据支持。

数据集特点

增强特性: 包括对象接地、旋转和场景中多对象支持。
数据来源: 使用来自Objaverse和Amazon Berkeley Objects (ABO)的3D资产。
渲染工具: 使用BlenderProc渲染每个3D对象及其对应的深度图、法线图和分割掩码。
视图生成: 每个对象生成三个随机视图，并应用不同的增强。

数据集来源

GitHub仓库: https://github.com/val-iisc/MirrorVerse
论文: https://openaccess.thecvf.com/content/CVPR2025/papers/Dhiman_MirrorVerse_Pushing_Diffusion_Models_to_Realistically_Reflect_the_World_CVPR_2025_paper.pdf
arXiv论文: https://arxiv.org/abs/2504.15397
项目页面: https://mirror-verse.github.io/

数据集结构

数据集以tar文件形式存储，每个文件包含约2000个对象的3个渲染。解压后的目录结构如下：

hf-objaverse-v4/ 000-010/ 8014aa16057a495795f7bf8a02a3ebe0/ 0.hdf5 1.hdf5 2.hdf5 ... abo_v4/ 4/ B0727Q5F94/ 0.hdf5 1.hdf5 2.hdf5 ... abo_v4_multiple/ 0/ B00BBDF500_B07BMTN6GF/ 0.hdf5 1.hdf5 2.hdf5 ...

主要文件说明

文件名/文件夹	描述
abo_v4/	包含来自ABO数据集的渲染。
abo_v4_multiple/	包含来自ABO数据集的多对象渲染。
hf-objaverse-v4/	包含来自Objaverse数据集的渲染。
abo_split_all.csv	包含ABO数据集的UID、hdf5文件路径和自动生成的标题。
objaverse_split_all.csv	包含Objaverse数据集的UID、hdf5文件路径和自动生成的标题。
train_abo.csv	包含用于训练的ABO数据集UID。
test_abo.csv	包含用于测试的ABO数据集UID。
train_objaverse.csv	包含用于训练的Objaverse数据集UID。
test_objaverse.csv	包含用于测试的Objaverse数据集UID。
train.csv/test.csv	包含训练和测试的UID组合，测试集包含`is_novel`列。
0.hdf5	包含单个对象的渲染数据，包括颜色、深度、法线图等。

数据提取代码示例

python import h5py import json import numpy as np

def extract_data_from_hdf5(hdf5_path: str): hdf5_data = h5py.File(hdf5_path, "r") data = { "image": np.array(hdf5_data["colors"], dtype=np.uint8), "mask": (np.array(hdf5_data["category_id_segmaps"], dtype=np.uint8) == 1).astype(np.uint8) * 255, "object_mask": (np.array(hdf5_data["category_id_segmaps"], dtype=np.uint8) == 2).astype(np.uint8) * 255, "depth": np.array(hdf5_data["depth"]), "normals": np.array(hdf5_data["normals"]), "cam_states": np.array(hdf5_data["cam_states"]), } return data

def decode_cam_states(cam_states): array = np.array(cam_states) json_str = array.tobytes().decode("utf-8") data = json.loads(json_str) cam2world = data["cam2world"] cam_K = data["cam_K"] return cam2world, cam_K

引用

bibtex @inproceedings{dhiman2025mirrorverse, title={MirrorVerse: Pushing Diffusion Models to Realistically Reflect the World}, author={Dhiman, Ankit and Shah, Manan and Babu, R Venkatesh}, booktitle={Proceedings of the Computer Vision and Pattern Recognition Conference}, pages={11239--11249}, year={2025} }

数据集联系人

Ankit Dhiman

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，高质量合成数据集的构建对于推动反射场景理解至关重要。SynMirrorV2数据集通过精心设计的流程构建，首先从Objaverse和Amazon Berkeley Objects（ABO）两大权威3D资源库中筛选高质量三维模型，随后利用BlenderProc渲染引擎生成包含深度图、法线图和分割掩码的全场景几何数据。每个物体均通过三个随机视角进行渲染，并施加物体定位、旋转及多物体场景组合等关键增强技术，最终形成包含20.7万样本的大规模合成数据集。

使用方法

研究人员可通过HDF5格式高效访问数据集的多模态信息，每个样本文件包含色彩图像、镜面掩码、物体掩码、深度图、法线图和相机状态六类核心数据。使用专用解码函数可提取相机内外参数，便于几何一致性验证。数据集配套提供详尽的CSV划分文件，明确标识训练测试集及新颖类别，支持镜像反射生成、三维重建等多任务研究。用户需按照官方提供的Python代码规范进行数据加载，确保与原始论文实验设置的一致性。

背景与挑战

背景概述

计算机视觉领域对镜面反射场景的建模长期存在技术瓶颈，SynMirrorV2数据集由印度科学理工学院视觉与人工智能实验室于2025年构建，旨在解决扩散模型在镜面反射场景中的物理一致性难题。该数据集基于Objaverse和亚马逊伯克利对象数据库，通过BlenderProc渲染引擎生成包含深度图、法线图和分割掩码的20.7万样本，为镜面反射的几何建模提供了大规模合成数据基础，显著推动了CVPR'25会议中镜面反射生成任务的研究进展。

当前挑战

镜面反射生成任务需解决反射几何一致性、多物体空间关系建模及真实感渲染等核心难题。数据集构建过程中面临三维资产质量筛选、多视角渲染参数优化、镜面反射物理属性标注等挑战，特别在处理透明材质与复杂光照交互时需克服渲染噪声问题，同时需确保训练集与测试集在物体类别分布上的科学划分以验证模型泛化能力。

常用场景

经典使用场景

在计算机视觉领域，SynMirrorV2数据集为镜面反射场景的生成与理解提供了关键支撑。该数据集通过BlenderProc渲染技术，构建了包含深度图、法线图和分割掩码的合成场景，特别适用于训练扩散模型在复杂镜面反射环境中的图像生成能力。研究者可利用其多视角渲染数据，探索物体在镜面环境中的几何一致性表现，为视觉算法在反射场景下的鲁棒性评估奠定基础。

解决学术问题

该数据集有效解决了镜面反射场景中三维几何重建与真实感渲染的学术难题。通过提供精确的深度信息与法线映射，它支持学术界研究镜面物体的物理反射特性与光线传播模型。其丰富的标注数据突破了传统方法在反射表面处理中的局限性，为多物体交互场景下的反射建模提供了标准化评估基准，显著推进了计算机视觉与计算摄影学在反射处理领域的研究进程。

实际应用

在现实应用层面，SynMirrorV2为增强现实与虚拟现实系统提供了高质量的反射场景训练数据。电商平台可借助其多物体渲染数据优化商品在镜面环境中的展示效果，室内设计行业则能通过其几何一致性数据提升虚拟场景的视觉真实感。自动驾驶系统亦可利用该数据集训练车载摄像头在复杂反射环境中的物体识别能力，提升系统在雨天或玻璃幕墙场景下的感知可靠性。

数据集最近研究