cmevs-erp-eval
收藏Hugging Face2026-05-06 更新2026-05-07 收录
下载链接:
https://huggingface.co/datasets/anon-cmevs-2026/cmevs-erp-eval
下载链接
链接失效反馈官方服务:
资源简介:
CM-EVS 是一个经过精心策划的全景 RGB-D 数据集,其核心设计原则是通过尽可能少的等距柱状投影(ERP)帧来最大化 3D 场景的几何覆盖。该数据集包含一个可重新分发的 Blender 室内数据存档和四个许可证感知的适配器包,这些适配器包可从上游源本地重新生成匹配的帧。当前版本(v1.0)包含 374 个室内场景实例和 13,631 个 ERP RGB-D-姿态帧。数据集适用于全景深度估计、ERP 新视角合成、数据中心的视点策略比较等任务。每个 ERP 帧遵循统一的坐标约定,包括世界坐标系、相机坐标系、姿态表示和 ERP 像素坐标。数据集还提供了详细的元数据和目录结构,便于使用和验证。
创建时间:
2026-05-03
原始信息汇总
CM-EVS 数据集概述
CM-EVS(Coverage-Maximizing Equirectangular Viewpoint Sampling) 是一个经过精挑细选的环视 RGB-D 数据集,其核心原则是:用最少的等距柱状投影(ERP)帧,最大化对 3D 场景的几何覆盖。
数据集构成
数据集包含一个可直接再分发的 Blender 室内数据存档,以及四个遵循上游许可协议的适配器包。
| 数据来源 | 许可协议 | 发布方式 | 场景/帧数量 |
|---|---|---|---|
| Blender 室内 | CC-BY 4.0 | 完整数据 (blender_indoor/) |
374 个场景 / 13,631 帧 |
| HM3D | 上游 EULA | 仅适配器 (adapters/hm3d/) |
401 个房间 / 仅可本地生成 |
| ScanNet++ | 上游 ToS | 仅适配器 (adapters/scannetpp/) |
500 次扫描 / 仅可本地生成 |
| OB3D(室外) | 上游许可 | 仅适配器 (adapters/ob3d/) |
24 / 仅可本地生成 |
| TartanGround(室外) | 上游许可 | 仅适配器 (adapters/tartanground/) |
762 个部分 / 仅可本地生成 |
核心说明:
- Blender 室内帧是唯一可直接再分发的 RGB-D 数据。
- 对于其余四个受限来源,数据集仅提供适配器(配置、管道脚本、场景ID元数据),用户需自行获取上游数据并在本地运行适配器以生成匹配的 ERP 帧。
输出数据格式
每一帧 ERP 数据遵循统一的坐标约定:
- 世界坐标系:右手系,
+X向右,+Y向上,+Z向前 - 相机坐标系:OpenCV 标准(
+x图像右,+y图像下,+z相机向前) - 位姿:标量优先的四元数
q_wc = [w, x, y, z]加相对位置C_w − C_{w,0}(相对于场景第一帧的中心) - ERP 像素坐标:经度
(u/W − 0.5) · 2π,纬度(0.5 − v/H) · π - 深度:每个像素存储从相机中心到表面的径向距离(非透视
z深度),无效像素标记为 NaN 或 0
| 文件 | 格式 | 描述 |
|---|---|---|
panorama_{NNNN}.png |
PNG, 2048×1024 | ERP RGB 图像 |
panorama_{NNNN}_depth.npy |
float32 数组 | ERP 径向深度(米);NaN 或 0 表示无效 |
pose_{NNNN}.json |
JSON | 包含 q_wc、位置、camera_type |
数据集规模
| 统计项 | 数值 |
|---|---|
| 当前版本 | v1.0 |
| Blender 室内场景实例总数 | 374 个(201 个来自 round1+2,173 个来自 round2) |
| 总 ERP 帧数 | 13,631 帧 |
| 单帧分辨率 | 2048×1024 |
| 完整 Blender 室内存档大小 | 约 109 GB |
| 用于审阅的样本场景 | sence_indoor_0001(33 帧,约 250 MB) |
数据划分
- 默认划分:基于
sha256(new_scene_id) % 100的场景级 70/15/15 划分 - 下流全景深度实验(论文 §4.10)使用独立的 94 个场景子集,按 84/10/10 划分(3,400 / 362 / 423 帧)
推荐用途
- 全景深度估计
- ERP 新视角合成
- 数据驱动的视点策略比较
- 视点规划研究
- 全景高斯泼溅重建
- 全景世界模型预训练
许可信息
- Blender 室内帧:CC-BY 4.0
- 策展人代码:MIT
- 文档:CC-BY 4.0
- 受限数据源:仅提供元数据和本地再生脚本,用户需遵守上游许可条款
代码与引用
代码仓库:huggingface.co/anon-cmevs-2026/cmevs-code
引用格式: bibtex @inproceedings{cmevs2026, title={{CM-EVS}: A Coverage-Curated Panoramic {RGB-D} Dataset for Indoor Scene Understanding}, author={Anonymous Author(s)}, booktitle={NeurIPS 2026 Datasets and Benchmarks Track (under review)}, year={2026} }
完整性校验
bash
顶层文件 + 适配器包 + 代码 + 元数据
shasum -a 256 -c SHA256SUMS
Blender 室内帧(39,896 条记录:13,631 张全景图 + 12,634 个深度数组 + 13,631 个位姿文件)
cd blender_indoor && shasum -a 256 -c SHA256SUMS
搜集汇总
数据集介绍

构建方式
CM-EVS数据集的构建源于一个清晰的核心理念:以最少的全景图帧数实现对三维场景的最大几何覆盖。其构建流程始于对各类三维资产的加载与坐标归一化,随后通过网格化策略生成候选视点,并施以26方向几何有效性过滤以剔除不可用候选。在此基础上,引入冲突感知的贪婪选择算法,在保证覆盖质量的同时最小化帧间冗余。最终,选定的视点经由Cycles渲染引擎生成高分辨率(2048×1024)的等距柱状投影RGB图像、径向深度图及相机位姿文件,并统一编码为标准化输出格式。该数据集不仅包含可直接分发的Blender室内场景帧,还针对外部受限源设计了适配器模块,用户可于本地运行适配脚本以生成格式一致的数据。
特点
该数据集最显著的特征在于其覆盖驱动(coverage-curated)的构建哲学,确保每一帧皆为最大化场景几何覆盖之关键。其输出遵循严格统一的坐标约定,采用右手系世界坐标与OpenCV相机坐标系,位姿以标量优先四元数表示,深度为径向距离而非透视深度。数据规模宏大,v1.0版本即包含374个Blender室内场景实例、共计13,631帧ERP数据,并辅以四个外部受限源适配器以扩展数据多样性。此外,该数据集提供了详尽的场景元数据、视点选择日志以及官方划分方案,支持全景深度估计、新型视角合成、视点规划等多项室内场景理解任务。
使用方法
使用该数据集时,开发者可直接加载`blender_indoor`目录下以场景编号组织的高分辨率全景图、深度数组与位姿JSON文件。对于HM3D、ScanNet++等受限源,需先于上游获取原始数据,再运行相应适配器中的配置与脚本,以复现统一模式下的匹配帧。数据集提供了以场景为单位的70/15/15默认划分方案,并通过`metadata/splits.json`给出。推荐的应用场景包括全景深度估计、ERP新型视角合成、基于数据的视点选择策略比较,以及全景高斯泼溅重建等。用户还可通过提供的SHA256SUMS校验文件完整性,确保数据的可复现性。
背景与挑战
背景概述
CM-EVS(Coverage-Maximizing Equirectangular Viewpoint Selection)数据集由匿名研究团队于2026年创建,旨在解决室内场景理解中全景视角采集的关键瓶颈。该数据集围绕“以最少的等距柱状投影帧最大化三维场景几何覆盖”这一核心原则构建,整合了374个Blender室内场景实例、13,631帧RGB-D全景数据,以及HM3D、ScanNet++等受限来源的适配器。作为NeurIPS 2026数据集与基准轨道的投稿,CM-EVS为固定预算视角选择策略、全景深度估计和新视角合成等研究方向提供了标准化评估平台,推动了数据驱动视角规划方法的发展。
当前挑战
该数据集面临的核心挑战包括:1)在室内场景理解中,如何设计视角选择策略以在有限采集预算下最大化几何覆盖,同时平衡信息冗余与场景完整性;2)数据集构建过程中需统一多源数据(合成与真实场景)的坐标系统、深度表示(径向距离而非透视深度)和姿态格式,处理受限源数据的许可证合规问题;3)需要构建有效的冲突感知贪心选择算法,以从大量候选视角中筛选出最优子集,并确保渲染效率与数据质量的一致性。
常用场景
经典使用场景
在三维场景理解与视觉感知领域,全景RGB-D数据集的构建始终面临视角覆盖效率与数据冗余之间的根本矛盾。CM-EVS数据集以全景等距柱状投影(ERP)帧为核心载体,通过最大化每帧对三维场景的几何覆盖度,实现了以最少帧数捕获完整场景信息的目标。其经典使用场景包括室内场景的深度估计、全景图像到图像的转换任务,以及视点选择与路径规划算法的评估。研究者可借助该数据集提供的标准化ERP帧序列、对应的范围深度图和相机位姿,系统性地分析不同视点采样策略对场景重建质量的影响,进而设计出更高效的数据采集方案。
衍生相关工作
围绕CM-EVS数据集所倡导的覆盖度驱动视点选择理念,学术界已催生出一系列值得关注的研究工作。其中最具代表性的包括基于信息论的视点收益预测模型、结合深度学习的非均匀全景采样策略,以及面向全景数据的transformer架构在深度估计任务中的应用。该数据集还间接推动了全景高斯泼溅重建中关键帧选取准则的量化研究,并启发了关于合成数据与真实数据在视点规划任务中领域迁移问题的探讨。这些衍生工作共同构建了从数据采集、视角优化到三维重建的完整研究链条。
数据集最近研究
最新研究方向
当前,以CM-EVS为代表的全景RGB-D数据集正引领室内场景理解领域的前沿研究,其核心聚焦于通过覆盖度驱动的视角选择策略,以最少等距柱状投影帧最大化3D场景的几何覆盖。这一方向与神经辐射场、3D高斯泼溅及世界模型等热点技术紧密结合,为固定预算下的视点规划与数据策展提供了理论基准。该数据集通过混合许可框架整合了Blender合成数据与HM3D、ScanNet++等真实场景适配器,推动了跨源数据统一格式与可复现性研究。尤为重要的是,其强调几何有效性过滤与冲突感知贪婪选择算法,为高效场景表征、新视角合成及深度估计任务提供了标准化评测平台,深刻影响了数据驱动型3D感知的实证方法论。
以上内容由遇见数据集搜集并总结生成



