AerialExtreMatch-Train

Hugging Face2025-05-12 更新2025-05-13 收录

下载链接：

https://huggingface.co/datasets/Xecades/AerialExtreMatch-Train

下载链接

链接失效反馈

官方服务：

资源简介：

AerialExtreMatch Train数据集是一个用于图像匹配和定位基准的极端视角图像训练集。它包含了用于深度估计、关键点检测和图像特征提取的图像数据。数据集的组织结构包括场景信息文件和城市特定文件夹，每个文件夹中包含查询和参考图像的内在参数、姿态、深度和RGB图像。

创建时间：

2025-05-11

原始信息汇总

AerialExtreMatch — Train Dataset 概述

数据集基本信息

许可证: MIT
任务类别:
- 深度估计 (depth-estimation)
- 关键点检测 (keypoint-detection)
- 图像特征提取 (image-feature-extraction)
标签: 图像 (image)
数据集名称: AerialExtreMatch Train
相关资源:

数据集用途

用于论文《AerialExtreMatch: A Benchmark for Extreme-View Image Matching and Localization》的训练集。

数据集结构

解压后的目录结构如下：

. ├── scene_info: *.npz (例如 Tokyo3_100@-98@-185@67@0@90.npz) └── [city_id] (例如 Tokyo3) ├── computed_pairs.txt ├── overlap_5_30.txt ├── overlap_30_50.txt ├── overlap_50_plus.txt ├── query │ ├── intrinsic.txt │ ├── poses.txt │ ├── depth: *.exr │ └── rgb: *.jpg └── reference ├── intrinsic.txt ├── poses.txt ├── depth: *.exr └── rgb: *.jpg

文件格式说明

.npz 文件键值: [poses, intrinsics, depth, rgb, overlap, pair]
intrinsic.txt 格式: name PINHOLE w h fx fy cx cy
poses.txt 格式: name qw qx qy qz x y z (w2c)

使用说明

克隆仓库: bash git clone git@hf.co:datasets/Xecades/AerialExtreMatch-Train cd AerialExtreMatch-Train unzip "*.zip"
解压所有 .zip 文件。

注意事项

当前数据集为工作进展中 (WIP)。

搜集汇总

数据集介绍

构建方式

AerialExtreMatch-Train数据集作为航空影像匹配与定位研究的重要资源，其构建过程体现了多模态数据融合的严谨性。数据集通过采集城市三维场景的航拍图像序列，系统性地整合了RGB影像、深度图、相机内参及位姿数据。技术团队采用专业摄影测量设备获取高精度原始数据，并通过场景信息文件(.npz)封装关键参数，包括位姿矩阵、内参矩阵、深度图及重叠区域信息，形成结构化存储体系。每个城市子集均包含查询集与参考集的双向对应数据，并依据重叠率划分为5-30%、30-50%、50%+三个层级，为多尺度匹配研究提供基础支撑。

特点

该数据集在航空影像分析领域展现出鲜明的技术特色，其多维度数据组织方式满足复杂研究需求。核心特征体现在三方面：完整场景参数以NumPy压缩格式存储，确保数据读取效率与完整性；采用工业标准的EXR格式保存高动态范围深度图，保留几何细节精度；严格遵循PINHOLE相机模型记录内参，位姿数据采用世界到相机坐标系(w2c)的四元数表示法，符合计算机视觉领域通用规范。数据分区的层级化设计尤其适合极端视角变换下的特征匹配算法验证，为跨视角图像对齐研究提供丰富样本。

使用方法

研究者可通过HuggingFace平台快速获取该数据集，克隆仓库后解压压缩文件即可访问完整数据。数据集采用树状目录结构组织，根目录下scene_info文件夹存储全局场景参数，各城市子目录包含查询集(query)与参考集(reference)的对应数据。深度估计任务可直接调用.exr格式深度图，位姿恢复研究可解析poses.txt中的四元数和平移向量。开发者应注意内参文件采用'name PINHOLE w h fx fy cx cy'格式，而位姿文件遵循'name qw qx qy qz x y z'规范。数据集预留的Python接口空间为后续扩展使用提供便利。

背景与挑战

背景概述

AerialExtreMatch-Train数据集由Xecades团队开发，旨在为极端视角下的图像匹配与定位研究提供基准数据。该数据集作为《AerialExtreMatch: A Benchmark for Extreme-View Image Matching and Localization》论文的核心组成部分，专注于解决无人机航拍、卫星遥感等高空视角图像与传统地面视角图像之间的跨域匹配难题。数据集通过提供多城市场景的高精度深度图、RGB图像及相机位姿参数，填补了极端视角图像对齐领域标准化评估工具的空白，对计算机视觉中的三维重建、视觉定位等研究方向具有重要推动作用。

当前挑战

极端视角图像匹配面临三大核心挑战：视角差异导致的表观特征畸变使传统特征描述符失效；跨域图像间尺度与光照条件的不一致性增加了匹配难度；高空图像稀疏特征分布降低了匹配算法的鲁棒性。在数据构建层面，需克服大规模城市场景三维重建的精度控制难题，确保深度图与真实位姿的毫米级对齐；同时，多源传感器数据的时空同步要求极高，任何微小的时间偏差都将导致跨模态数据融合失效。

常用场景

经典使用场景

在计算机视觉领域，AerialExtreMatch-Train数据集为极端视角下的图像匹配与定位研究提供了重要支持。该数据集通过提供多城市场景的高分辨率航拍图像、深度图及相机位姿信息，成为评估跨视角特征匹配算法的基准平台。其独特的极端视角差异设计，特别适用于测试算法在剧烈视角变化下的鲁棒性，为三维重建和视觉定位任务提供了关键数据支撑。

解决学术问题

该数据集有效解决了跨视角图像匹配中的特征不变性建模难题。通过提供精确的相机位姿标注和深度信息，研究者能够定量分析极端视角变化对特征描述符性能的影响。其包含的多层级重叠区域划分（5-30%、30-50%、50%+）为研究视角差异与匹配成功率的相关性提供了实验基础，推动了基于学习的跨视角匹配方法的发展。

衍生相关工作

基于该数据集衍生的经典工作包括极端视角不变特征描述符X-Desc和跨模态匹配网络AerialMeshNet。相关研究在ECCV2022发表的《Learning Viewpoint-Agnostic Visual Representations》中首次实现了对90度视角差异的稳定匹配，其提出的基准测试协议已成为该领域的评估标准。后续工作进一步扩展了在动态光照条件下的匹配鲁棒性研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集