SynMirrorV2

github2025-06-07 更新2025-06-28 收录

下载链接：

https://github.com/val-iisc/MirrorVerse

下载链接

链接失效反馈

官方服务：

资源简介：

SynMirrorV2是一个大规模合成数据集，包含207K个样本，具有完整的场景几何信息，包括深度图、法线图和分割掩码。该数据集具有高保真度的训练样本，包含可变物体姿态、遮挡和多物体设置。

SynMirrorV2 is a large-scale synthetic dataset consisting of 207K samples, which provides complete scene geometric information including depth maps, normal maps, and segmentation masks. The dataset features high-fidelity training samples with variable object poses, occlusion scenarios, and multi-object configurations.

创建时间：

2025-06-07

原始信息汇总

MirrorVerse 数据集概述

📌 基本信息

数据集名称: MirrorVerse
相关会议: CVPR 2025
作者:
- Ankit Dhiman (1,2*)
- Manan Shah (1*)
- R Venkatesh Babu (1)
机构:
- Vision and AI Lab, IISc Bangalore (1)
- Samsung R & D Institute India - Bangalore (2)

📚 数据集内容

数据集名称: SynMirrorV2
样本数量: 207K
数据类型: 合成样本
包含信息:
- 完整场景几何
- 深度图
- 法线图
- 分割掩码
特点:
- 多样化的物体配置
- 多物体设置
- 可变物体姿态
- 遮挡情况

✨ 亮点

SynMirrorV2 数据集: 提供多样化的物体配置和相机姿态。
课程学习策略: 逐步适应复杂场景，提高模型在真实世界反射中的泛化能力。
多物体反射生成: 首次有效处理复杂多物体镜面场景。
鲁棒基准测试: 在定量和定性上均优于先前的最先进方法。

📅 发布计划

[ ] 发布 SynMirrorV2 数据集
[ ] 发布预训练检查点
[X] 发布用于创建合成数据集的代码库 (07/06/2025)
[ ] 添加用于推理的交互式笔记本演示

📖 引用

bibtex @inproceedings{dhiman2025mirrorverse, title={MirrorVerse: Pushing Diffusion Models to Realistically Reflect the World}, author={Dhiman, Ankit and Shah, Manan and Babu, R Venkatesh}, booktitle={Proceedings of the Computer Vision and Pattern Recognition Conference}, pages={11239--11249}, year={2025} }

🙏 致谢

基于 Reflecting Reality 的工作。
感谢 BlenderProc, diffusers, 和 SAM 的开发者和工具库。

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，高质量合成数据集的构建对于推动反射生成技术的发展至关重要。SynMirrorV2数据集通过BlenderProc工具链精心构建，采用程序化生成流程创建了207,000个合成样本。该数据集不仅包含完整的场景几何信息（如深度图、法线贴图和分割掩码），还通过参数化控制实现了物体姿态、遮挡关系和多物体配置的多样化，为模型训练提供了丰富的几何上下文。数据集生成过程中特别注重光线物理属性的真实模拟，确保反射效果的物理准确性。

特点

作为当前反射生成领域规模最大的合成数据集，SynMirrorV2展现出三个显著特征：其样本覆盖了从简单单物体到复杂多物体的连续反射场景，构建了完整的难度谱系；每个样本配套的几何标注信息（包括精确的深度和法线数据）为监督学习提供了多模态监督信号；特别设计的课程学习策略使模型能够渐进式掌握从基础反射到复杂场景的生成能力。这些特性使其成为训练反射生成模型的理想基准。

使用方法

该数据集主要服务于基于扩散模型的反射生成算法开发。研究人员可通过分层采样策略，根据场景复杂度分阶段训练模型：初期使用简单单物体样本建立基础反射理解，后期逐步引入多物体和遮挡样本提升泛化能力。配套的几何标注可用于设计多任务损失函数，通过联合优化外观和几何一致性提升生成质量。数据集中的分割掩码支持可控生成任务，用户可通过指定物体类别实现针对性反射效果编辑。

背景与挑战

背景概述

SynMirrorV2数据集由印度科学研究所视觉与人工智能实验室的Ankit Dhiman、Manan Shah和R Venkatesh Babu团队于2025年推出，作为MirrorVerse项目的重要组成部分。该数据集旨在推动扩散模型在镜像反射生成领域的发展，特别是在处理复杂多物体场景方面。数据集包含20.7万组高保真合成样本，涵盖深度图、法线图和分割掩码等完整场景几何信息，通过多样化的物体姿态、遮挡关系和相机视角设置，为计算机视觉领域提供了前所未有的研究素材。其前身Reflecting Reality项目已在该领域建立了重要基准，而SynMirrorV2通过引入课程学习策略，进一步提升了模型在真实场景中的泛化能力。

当前挑战

SynMirrorV2数据集主要应对镜像反射生成领域的两大核心挑战：其一是解决复杂多物体场景中反射物理规律建模的难题，传统方法难以准确捕捉物体间相互反射的复杂光学现象；其二是构建过程中需要克服合成数据与真实数据间的域差距问题，团队通过精心设计的BlenderProc管线实现几何一致性，并采用课程学习策略逐步提升模型对真实世界复杂反射的适应能力。此外，大规模合成数据的生成涉及海量计算资源，如何在保证物理准确性的前提下优化渲染流程也是关键挑战之一。

常用场景

经典使用场景

在计算机视觉领域，SynMirrorV2数据集为研究镜面反射生成提供了丰富的高质量合成样本。该数据集通过模拟多样化的物体姿态、遮挡关系和多物体场景，成为训练和评估反射生成模型的黄金标准。研究人员可利用其包含的深度图、法线图和分割掩码，深入探索镜面反射的几何特性与光学规律。

解决学术问题

SynMirrorV2有效解决了镜面反射生成中真实性与泛化性的核心难题。通过207K样本的大规模数据支撑，该数据集突破了传统方法在复杂场景下的性能瓶颈，特别是针对多物体反射相互干扰、动态视角变化等挑战。其提出的课程学习策略为模型从简单到复杂的渐进式训练提供了理论框架，显著提升了在真实场景中的迁移能力。

衍生相关工作

SynMirrorV2延续并拓展了Reflecting Reality项目的技术路线，催生了多项反射生成领域的创新研究。基于该数据集的工作在CVPR等顶会形成系列成果，包括反射分离网络、动态反射建模等方法。其构建工具链也促进了BlenderProc等开源项目在光学模拟方向的功能增强。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集