Pano-Infinigen
收藏Hugging Face2026-02-21 更新2026-02-22 收录
下载链接:
https://huggingface.co/datasets/prs-eth/Pano-Infinigen
下载链接
链接失效反馈官方服务:
资源简介:
Pano-Infinigen 是一个高分辨率全景图像的合成数据集,采用等距柱状投影(ERP)格式,包含完美对齐的RGB图像、深度图和表面法线图。该数据集使用改进的Infinigen框架生成,支持广角全景几何。作为PaGeR(一种用于零样本全景深度和法线估计的单步扩散模型)的主要训练数据,该数据集包含室内和室外场景,分为训练集、验证集和测试集。每个样本包含8位RGB全景图像(PNG格式)、深度图(二进制.npy文件,float16格式,范围[0,75]米)和表面法线图(二进制.npy文件,float16格式,范围[-1,1])。数据集总大小约为6.1GB(室内4.5GB,室外1.6GB),样本数量分别为室内60个(48训练/6验证/6测试)和室外20个(16训练/2验证/2测试)。
Pano-Infinigen is a synthetic dataset of high-resolution panoramic images in equirectangular projection (ERP) format, which contains perfectly aligned RGB images, depth maps and surface normal maps. This dataset is generated using an improved Infinigen framework and supports wide-angle panoramic geometry. As the primary training data for PaGeR—a single-step diffusion model for zero-shot panoramic depth and normal estimation—the dataset covers both indoor and outdoor scenes and is split into training, validation and test sets. Each sample includes 8-bit RGB panoramic images in PNG format, depth maps stored as binary .npy files in float16 format with a range of [0, 75] meters, and surface normal maps stored as binary .npy files in float16 format with a range of [-1, 1]. The total size of the dataset is approximately 6.1 GB, with 4.5 GB for indoor scenes and 1.6 GB for outdoor scenes. The number of samples is 60 for indoor scenes (48 for training, 6 for validation, and 6 for test) and 20 for outdoor scenes (16 for training, 2 for validation, and 2 for test).
创建时间:
2026-02-21
搜集汇总
数据集介绍
构建方式
在计算机视觉领域,合成数据集为全景图像理解任务提供了精确的标注基础。Pano-Infinigen数据集通过改进的Infinigen框架生成,该框架专为模拟宽视场几何而设计。构建过程采用程序化内容生成技术,创建了涵盖室内与室外场景的高分辨率全景图像,并以等距柱状投影格式呈现。每一场景均包含严格对齐的RGB图像、深度图与表面法线图,深度值以浮点十六位精度存储,范围设定在零至七十五米之间,确保了数据的物理一致性与高保真度。
使用方法
为有效利用该数据集进行全景深度与法线估计研究,需遵循特定的加载流程。通过Hugging Face的`datasets`库加载指定配置与分割的数据集后,RGB图像可直接以PIL格式获取。对于深度与法线数据,因其存储为二进制字节流,需借助`io.BytesIO`接口与NumPy库进行解析,还原为浮点十六位数组。此方法确保了从数据加载到模型输入流程中,高精度几何信息的无损传递,为训练如PaGeR等单步扩散模型提供了可靠的数据基础。
背景与挑战
背景概述
全景视觉感知作为计算机视觉领域的重要分支,致力于从全方位视角理解三维场景的几何与语义信息。Pano-Infinigen数据集由苏黎世联邦理工学院(ETH Zurich)的研究团队于2025年创建,其核心研究问题聚焦于解决单目全景图像中深度与表面法向量的精确估计。该数据集基于改进的Infinigen框架生成,提供了高分辨率、多模态对齐的全景合成数据,为PaGeR等扩散模型的训练提供了关键支撑,显著推动了零样本全景几何理解技术的发展,并在虚拟现实、机器人导航等应用领域展现出重要影响力。
当前挑战
在领域问题层面,单目全景深度与法向量估计面临严峻挑战,包括全景图像中存在的严重几何畸变、无限远点深度定义模糊,以及复杂光照与材质导致的表面法向量歧义性。这些因素使得模型难以从单一二维全景图像中准确恢复三维几何信息。在构建过程中,数据集生成需克服合成场景的真实性与多样性平衡难题,确保全景投影下的多模态数据(RGB、深度、法向量)实现像素级精确对齐,同时处理大规模高分辨率数据存储与高效加载的技术瓶颈,以保障数据精度与可用性。
常用场景
经典使用场景
在计算机视觉与三维场景理解领域,全景图像因其广阔的视野而备受关注。Pano-Infinigen数据集以其高分辨率全景图像及精确对齐的深度与法线信息,为单目全景深度估计与表面法线预测任务提供了经典的训练与评估基准。研究者常利用该数据集构建扩散模型,如PaGeR,通过合成数据驱动的方式,实现在复杂室内外场景中从单一全景图像直接推断几何属性,有效解决了真实全景数据标注稀缺的难题。
解决学术问题
该数据集主要针对全景视觉中几何理解的核心学术问题。传统方法在全景领域面临标注数据匮乏、几何真值获取成本高昂的挑战。Pano-Infinigen通过程序化生成的合成场景,提供了像素级精确的深度与法线真值,使得数据驱动的深度学习方法得以在全景设定下进行可靠训练与验证。它推动了零样本全景深度估计、表面重建以及跨模态几何推理等研究方向的发展,为探索全景表示的固有歧义性与投影变形问题提供了标准化实验平台。
实际应用
超越纯学术探索,Pano-Infinigen数据集支撑的技术在增强现实、虚拟现实及机器人导航等实际场景中展现出应用潜力。基于其训练的模型能够从消费级全景相机捕获的图像中实时恢复场景三维结构,这对于室内空间建模、虚拟环境构建以及自主系统的环境感知至关重要。例如,在房地产可视化或游戏内容创作中,该技术可快速生成带几何信息的全景漫游体验;在机器人领域,则为在复杂非结构化环境中的路径规划与避障提供了丰富的几何先验。
数据集最近研究
最新研究方向
在计算机视觉与三维场景理解领域,全景图像因其能够捕捉360度完整环境信息而备受关注。Pano-Infinigen数据集作为高分辨率合成全景数据集,其精确对齐的RGB、深度与表面法线模态,正推动着零样本全景深度与法线估计的前沿研究。基于该数据集训练的PaGeR等单步扩散模型,展现了在无需真实标注数据下,从单张全景图像中恢复密集几何信息的潜力,这直接响应了自动驾驶、虚拟现实等应用对高效、鲁棒三维场景解析技术的迫切需求。相关研究热点集中于利用合成数据克服真实全景数据标注稀缺的瓶颈,探索生成式模型在跨域几何推理中的泛化能力,其进展对提升沉浸式环境感知系统的实用性与可扩展性具有显著意义。
以上内容由遇见数据集搜集并总结生成



