TerraSky3D
收藏TerraSky3D 数据集概述
基本信息
- 数据集名称:TerraSky3D
- 许可证:MIT
- 任务类别:图像到3D、深度估计、图像到图像
- 语言:英语
- 标签:3D、多视图立体视觉、运动恢复结构、航空影像、空地视角、欧洲地标
- 数据规模:10K<n<100K
核心描述
TerraSky3D 是一个高分辨率、大规模的三维重建数据集,包含 50,000 张图像,分为 155 个地面、航空及混合场景。该数据集专注于欧洲地标,并提供经过整理的校准数据、相机位姿和深度图,旨在满足训练和评估三维重建相关流程对具有挑战性数据集的需求。
数据统计
训练集/测试集统计(v1.0版)
| 指标 | 测试集 | / | 训练集 | 描述 |
|---|---|---|---|---|
| 场景数量 | 133 | / | 12 | 场景总数。 |
| 图像数量 | 42,992 | / | 3,018 | 数据集中提供的高分辨率(4K)图像数量。 |
| 图像对总数 | 2,624,784 | / | 43,720 | 捕获的总立体/重叠图像对数量。 |
| ↳ 地面视角对 | 1,682,869 | / | 32,718 | 仅从地面视角捕获的图像对。 |
| ↳ 航空视角对 | 728,502 | / | 6,308 | 仅从航空视角捕获的图像对。 |
| ↳ 混合视角对 | 213,413 | / | 4,694 | 同时包含航空和地面视角的图像对。 |
数据下载与格式
-
下载地址:https://huggingface.co/datasets/mattia-durso/TerraSky3D
-
数据查看工具:可使用
data_viewer.ipynb生成train_data.json并可视化数据集中的图像对示例。 -
数据目录结构:
data/scene/ ├── colmap/ # COLMAP格式的运动恢复结构输出 │ └── sparse/ │ └── 0/
│ ├── cameras # 相机内参 │ ├── images # 相机外参/位姿 │ └── points3D # 稀疏点云 ├── frames/ # 提取的视频帧 │ ├── cam_0/ │ │ └── frame_000000.jpg # 格式: cam_i/frame_*.jpg │ ├── cam_1/ │ │ └── frame_000000.jpg │ └── ... ├── depth/ # 多视图立体视觉深度输出 │ ├── maps/ # 来自APD-MVS的原始深度估计 │ │ ├── cam_0/ │ │ │ └── frame_000000.h5 │ │ └── ... │ ├── masks_geometric/ # 来自APD-MVS的几何掩码 │ │ ├── cam_0/ │ │ │ └── frame_000000.png │ │ └── ... │ └── masks_semantic/ # 来自Mask2Former的语义掩码 │ ├── cam_0/ │ │ └── frame_000000.png │ └── ... └── train_data.json # 包含场景、图像和相机参数的字典
相关资源
- 论文:https://arxiv.org/abs/2603.28287
- 代码仓库:https://github.com/mattiadurso/TerraSky3D
引用
如果此数据集或代码对您的研究有帮助,请考虑引用: bibtex @article{durso202Xterrasky3d, title={TerraSky3D: Multi-View Reconstructions of European Landmarks in 4K}, author={DUrso, Mattia and Hu, Yuxi and Rossi, Mattia and Sormann, Christian and Fraundorfer, Friedrich}, booktitle={IEEE Conference on Computer Vision and Pattern Recognition}, year={2026} }




