UAVFF3D

github2026-05-29 更新2026-06-01 收录

下载链接：

https://github.com/yanxian-ll/UAVFF3D

下载链接

链接失效反馈

官方服务：

资源简介：

UAVFF3D是一个几何感知的真实-合成基准数据集，用于评估和适应无人机摄影测量采集下的前馈3D重建模型。它关注相机几何的鲁棒性，包括倾斜视角退化和水平视场-高度模糊性。数据集包含三个互补组件：UAVFF3D-Real（真实无人机图像与重建监督和激光雷达支持的真实世界测试场景）、UAVFF3D-Syn（从纹理化3D资产渲染的可控合成无人机数据，具有多样飞行高度、水平视场、天底视角、倾斜视角和不规则轨迹）和UAVFF3D-FA（受控的水平视场-高度诊断分割，其中水平视场和飞行高度变化而图像覆盖范围大致可比）。

UAVFF3D is a geometry-aware real-synthetic benchmark dataset for evaluating and adapting feed-forward 3D reconstruction models in UAV photogrammetric acquisition scenarios. It focuses on the robustness of camera geometry, including tilted view degradation and horizontal FOV-altitude ambiguity. The dataset includes three complementary components: UAVFF3D-Real (real-world test scenarios with real UAV images, reconstruction supervision, and LiDAR support), UAVFF3D-Syn (controllable synthetic UAV data rendered from textured 3D assets, featuring diverse flight altitudes, horizontal FOVs, nadir views, tilted views, and irregular trajectories), and UAVFF3D-FA (controlled horizontal FOV-altitude diagnostic splits, where horizontal FOV and flight altitude vary while the image coverage remains roughly comparable).

创建时间：

2026-05-12

原始信息汇总

UAVFF3D 数据集概述

UAVFF3D 是一个面向无人机前馈式三维重建的几何感知真实-合成混合基准数据集，专注于评估和适应无人机摄影测量采集场景下的前馈式三维重建模型。其核心关注相机几何鲁棒性问题，包括倾斜视角退化与水平视场角-高度模糊性。

数据集目标

无人机领域适应：提供真实和合成的无人机风格数据，用于微调前馈式重建模型。
度量级真实世界评估：在具有激光雷达支持或基于重建参考几何的真实无人机场景上评估重建质量。
受控相机几何诊断：分析由倾斜采集和水平视场角-高度模糊性导致的失败模式。

数据集构成与发布

UAVFF3D 包含三个互补的组成部分，所有数据均通过百度网盘发布（提取码：1234）。

组成部分	描述	主要用途
UAVFF3D-Real	真实无人机影像，包含重建监督信息和激光雷达支持的真实世界测试场景。	真实世界评估和无人机领域适应。
UAVFF3D-Syn	可控的合成无人机数据，从带纹理的3D资产渲染而来，包含多样化的飞行高度、水平视场角、正射/倾斜视角及不规则轨迹。	相机几何覆盖和合成无人机领域适应。
UAVFF3D-FA	受控的水平视场角-高度诊断子集，在图像足迹大致相当的情况下改变水平视场角和飞行高度。	投影几何与度量尺度鲁棒性诊断。

合成数据部分按规模进一步组织为 UAVFF3D-Syn-L（大规模）和 UAVFF3D-Syn-S（小规模/局部）子文件夹。

配套资源

资源	作用
数据集处理管线 (UAVFF3D-Pipeline)	将 UAVFF3D 及外部数据集转换为统一格式，生成元数据和划分文件，构建共视图。
微调与评估框架 (uavff3d_evaluate_forward_models)	提供下游微调和基准评估框架，包含数据加载器、配置、脚本及评估设置。
微调检查点 (百度网盘，提取码：1234)	提供针对 Pi3、Pi3X、MapAnything 和 VGGT 等模型的微调权重。

统一场景格式

所有处理后的场景遵循统一的数据格式，包含以下文件和目录结构：

scene/ images/ # 图像 (PNG格式) cams/ # 相机参数 (文本格式) depth/ # 深度图 (EXR格式) mask/ # 遮罩 (PNG格式，可选) scene_meta.json # 场景元数据

相机参数文件采用 BlendedMVS 风格文本格式，包含外参矩阵（世界到相机）、内参矩阵、以及图像高度、宽度和水平视场角。

评估协议

UAVFF3D 采用联合对齐的评估协议，即估计一个场景级的相似变换，并一致地应用于预测的稠密几何和预测的相机，以暴露相机-场景间的不一致性。主要评估指标包括：

指标	目标
AbsRel Depth	图像对齐的度量深度精度
Ray Error	相机射线与投影几何一致性
Pose ATE	共享场景级对齐后的相机中心精度
Rotation MAE	相机朝向精度
Chamfer-L1	稠密3D几何精度

兼容性说明

项目及相关仓库的命名约定包括：UAVFF3D、UAVFF3D-Real、UAVFF3D-Syn、UAVFF3D-Syn-L、UAVFF3D-Syn-S、UAVFF3D-FA、uavff3d。

搜集汇总

数据集介绍

构建方式

UAVFF3D数据集由三大互补组件构成：UAVFF3D-Real提供真实无人机影像及LiDAR支持的真实场景重建监督，UAVFF3D-Syn通过从纹理化三维资产渲染生成可控合成数据，涵盖多种飞行高度、水平视场角及倾斜视角，而UAVFF3D-FA则针对水平视场角与高度耦合的歧义性设计诊断性子集。所有数据经由统一的数据处理流水线（UAVFF3D-Pipeline）处理，转化为标准化的场景格式，包含图像、相机参数、深度图及可选的掩膜，并生成场景元数据、共视图及训练/验证/测试划分文件。

特点

该基准的核心特色在于其几何感知设计，专注于无人机摄影测量中独特的相机-几何鲁棒性问题，包括倾斜视角退化与水平视场角-高度歧义。UAVFF3D融合了真实与合成数据，既支持域自适应微调，又提供可控的相机几何诊断能力。其统一的评估协议将相机位姿与密集几何视为耦合重建结果，通过共享场景级相似变换对齐，能够揭露独立对齐时可能隐藏的相机-场景不一致性，从而更严格地评估前馈三维重建模型在无人机视角下的表现。

使用方法

使用者可首先通过百度网盘链接获取各组件数据，并按照建议的目录结构组织。随后安装UAVFF3D-Pipeline执行数据预处理，依次运行脚本生成场景元数据、划分文件及共视图。微调与评估则需借助uavff3d_evaluate_forward_models仓库，该框架基于MapAnything接口，支持图像仅输入及多种先验输入模式（如相机内参、位姿），并提供预调优的模型检查点（如Pi3、VGGT等）。通过更新配置文件中的数据集路径与模型路径，即可启动训练或评估，并依据深度精度、射线误差、位姿ATE等指标衡量重建质量。

背景与挑战

背景概述

UAVFF3D是由Xiang Yang、Yongli Wang等学者于2026年提出的一个几何感知基准数据集，旨在解决前馈式无人机三维重建模型在面对无人机摄影测量采集时的泛化能力不足问题。随着前馈式三维重建技术的快速发展，模型能够直接从图像中预测相机参数、深度或稠密几何，然而通用重建数据集往往忽视了无人机影像特有的几何特性，如高空正射视角、倾斜多相机采集、视场角剧烈变化以及航高与水平视场角耦合导致的歧义性。该数据集由真实无人机场景、可控合成数据以及专为诊断航高-视场角歧义设计的测试子集构成，为评估和微调重建模型提供了统一框架，对推动无人机三维重建领域的标准化评估与模型鲁棒性研究具有重要影响力。

当前挑战

UAVFF3D所应对的核心挑战在于无人机影像几何特性的复杂性与现有前馈重建模型的不兼容性。具体表现为：无人机采集常包含高空垂直视角与大幅度倾斜视角，导致图像内容与相机坐标系间存在显著畸变，而多数预训练模型缺乏此类极端视角的样本覆盖；水平视场角与飞行高度耦合变化时，即使地面覆盖范围相似，投影几何与度量尺度也会发生根本性改变，模型难以区分这一歧义；此外，构建过程中需同时处理真实场景中的LiDAR辅助标定误差、合成数据渲染的真实性平衡，以及统一数据格式下的大规模协视图生成，这些均对数据质量与标注精度提出了严苛要求。

常用场景

经典使用场景

UAVFF3D数据集专为前馈式无人机三维重建模型的评估与适应而设计，其经典使用场景聚焦于无人机摄影测量特有的相机几何退化问题。该数据集通过提供真实与合成双模态数据，系统性地覆盖了高空垂直视角、倾斜多相机采集、大水平视场角变化以及视场角-高度耦合模糊等典型无人机影像几何特征。研究者可利用该基准在受控条件下诊断模型对倾斜视角退化与hFOV-高度歧义的鲁棒性，进而推动前馈重建模型从通用场景向无人机领域的专业化迁移。

解决学术问题

该数据集解决了当前前馈三维重建模型在无人机摄影测量场景中普遍存在的领域鸿沟问题。现有通用数据集中的相机几何分布与无人机采集模式存在显著差异，导致模型在处理倾斜视角、大视场角变化及度量尺度一致性时性能急剧下降。UAVFF3D通过构建包含真实LiDAR支持场景与可控合成数据的基准，揭示了相机-几何联合一致性这一核心学术难题，并建立了共享对齐评估协议，有效暴露了分别对齐相机与几何时隐藏的不一致性，为无人机条件下的三维重建研究提供了标准化的诊断工具与评测范式。

衍生相关工作

UAVFF3D的发布催生了一系列衍生研究工作，主要体现在以下方面：首先，基于该基准的微调评估框架已适配Pi3、Pi3X、MapAnything和VGGT等多种代表性前馈重建模型，形成了无人机三维重建的标准化评测平台。其次，其配套的数据处理管线UAVFF3D-Pipeline为外部无人机与MVS数据集的格式统一提供了可复用的开源方案。此外，可控几何诊断拆分（UAVFF3D-FA）的设计理念启发了对投影几何与度量尺度鲁棒性的专项研究，推动了针对视角退化与视场角-高度歧义的新型网络模块设计，拓展了前馈重建在非理想采集条件下的应用边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集