ACC-NVS1

Name: ACC-NVS1
Creator: Accenture Federal Services，Carnegie Mellon University
Published: 2025-03-24 22:24:08
License: 暂无描述

arXiv2025-03-24 更新2025-03-28 收录

下载链接：

http://arxiv.org/abs/2503.18711v1

下载链接

链接失效反馈

官方服务：

资源简介：

ACC-NVS1是一个专门为空中和地面图像的新型视图合成研究设计的多视图场景数据集，由Accenture Federal Services和Carnegie Mellon University共同创建。该数据集包含来自德克萨斯州奥斯汀和宾夕法尼亚州匹兹堡的六个独特真实世界场景，共计148,391张图像。数据集通过无人机、地面车辆移动测绘和其他手持成像设备收集，旨在补充现有数据集，为新型视图合成、特征匹配、3D几何和场景重建等视觉任务提供额外的资源。

ACC-NVS1 is a multi-view scene dataset specifically designed for novel view synthesis research on aerial and ground images, co-created by Accenture Federal Services and Carnegie Mellon University. The dataset includes six unique real-world scenes collected from Austin, Texas and Pittsburgh, Pennsylvania, with a total of 148,391 images. It was gathered using unmanned aerial vehicles (UAVs), ground vehicle-based mobile mapping, and other handheld imaging devices. This dataset aims to complement existing datasets, providing additional resources for visual tasks such as novel view synthesis, feature matching, 3D geometry and scene reconstruction.

提供机构：

Accenture Federal Services，Carnegie Mellon University

创建时间：

2025-03-24

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，新型视角合成（NVS）的研究亟需高质量的多视角数据集。ACC-NVS1数据集通过系统化的数据采集流程构建而成，覆盖了美国奥斯汀和匹兹堡六个不同的真实场景。数据采集采用了多样化的传感器组合，包括无人机搭载的广角相机、手持iPhone设备、背包式多摄像头系统以及车载球形相机，确保了多角度、多海拔的全面覆盖。采集过程中特别考虑了瞬态遮挡物的影响，通过人为引入遮挡物（如行人、车辆、镜头手指遮挡等）增强数据集的现实复杂性。所有图像均经过地理定位校准，并采用自动化与人工结合的方式去除个人身份信息（PII），确保数据合规性。

使用方法

该数据集适用于新型视角合成、三维重建、单目深度估计等前沿研究任务。使用者可通过提供的相机参数直接构建神经辐射场（NeRF）或3D高斯泼溅模型，亦能利用多视角图像进行运动恢复结构（SfM）与多视图立体（MVS）实验。针对瞬态遮挡的标注数据可用于开发抗干扰算法，而LiDAR数据则支持几何精度验证。研究人员可依据场景类型（如CMU-mill-19工业场景或ATX城市景观）选择子集，结合深度估计工具（如DepthAnythingV2）补全稀疏点云，优化三维重建效果。

背景与挑战

背景概述

ACC-NVS1数据集由Accenture Federal Services与卡内基梅隆大学的研究团队于2023至2024年间联合创建，旨在推动新颖视角合成（NVS）领域的研究。该数据集聚焦于空中与地面多视角图像融合，采集自美国奥斯汀和匹兹堡的六类真实场景，包含14.8万张高分辨率图像，并整合了RGB与LiDAR多模态数据。作为首个系统化覆盖城市建筑群空中-地面配对视角的数据集，它填补了传统数据集如KITTI（仅地面视角）和Mill 19（仅无人机视角）的空白，为三维视觉任务提供了更全面的基准环境。其创新性体现在严格的地理标定流程与动态遮挡物模拟设计，显著提升了复杂城市场景重建的可行性。

当前挑战

该数据集主要应对两大核心挑战：在领域问题层面，现有NVS模型对跨海拔视角变化的泛化能力不足，尤其当处理无人机与地面传感器采集的异构数据时，易因视角断层导致渲染失真；在构建过程中，需克服多传感器时空同步校准的工程难题，包括RTK-GPS、LiDAR与光学设备的毫米级位姿对齐。此外，动态遮挡物（如行人、车辆）的刻意引入虽增强现实性，但加剧了三维重建的拓扑结构完整性风险。数据合规性处理亦面临挑战，需通过自动化检测结合人工复核双重机制实现敏感信息脱敏，确保符合隐私保护法规要求。

常用场景

经典使用场景

在计算机视觉与图形学领域，ACC-NVS1数据集因其独特的空中与地面多视角采集特性，成为新型视角合成（NVS）研究的核心资源。该数据集通过无人机与地面设备同步捕获的14.8万张图像，覆盖了城市建筑、校园等复杂场景，为研究不同海拔视角转换、瞬态物体遮挡等挑战提供了真实数据支撑。其经典应用场景包括基于辐射场方法（如3D高斯泼溅和神经辐射场）的视角生成算法验证，尤其适用于需要融合空中与地面视角的跨域合成任务。

解决学术问题

ACC-NVS1填补了现有数据集中空中-地面配对视角稀缺的空白，解决了传统数据集因单一视角（如KITTI仅含地面影像或UrbanScene3D仅含航拍）导致的模型泛化性不足问题。通过提供精确校准的地理位置与相机参数，该数据集支持3D几何重建、特征匹配等基础研究，并推动了对瞬态物体（如行人、车辆）鲁棒性处理的算法创新。其多传感器融合设计进一步缓解了因采集设备差异引发的域适应挑战，为跨模态视觉任务建立了新基准。

实际应用

该数据集的实际价值体现在城市数字化建设与虚拟现实领域。例如，基于ACC-NVS1训练的模型可生成建筑群的高保真三维模型，辅助城市规划仿真；其包含的瞬态遮挡样本（如手指遮挡镜头）提升了监控系统对异常图像的识别能力。此外，结合LiDAR数据的地理定位精度，该数据集为自动驾驶系统提供了复杂城市场景的多视角测试环境，增强了算法在动态遮挡条件下的稳定性。

数据集最近研究