ReBO (Repairing Buildings in OpenStreetMap)
收藏arXiv2025-09-23 更新2025-09-24 收录
下载链接:
https://www.openstreetmap.org
下载链接
链接失效反馈官方服务:
资源简介:
ReBO数据集包含来自OpenStreetMap的历史标签和手动校正的屋顶与足迹标注,涵盖了5,473张图像和179,265个建筑实例,跨越22个国家、41个城市。该数据集旨在帮助研究人员开发更准确、鲁棒的建筑物多边形提取方法,以应对近地平线与离地平线遥感图像的挑战。数据集提供了高质量的前置信息,并保持了建筑结构的一致性,对于提高建筑多边形提取的精度具有重要意义。
The ReBO Dataset contains historical tags sourced from OpenStreetMap and manually corrected roof and footprint annotations. It covers 5,473 images and 179,265 building instances spanning 22 countries and 41 cities. This dataset is intended to help researchers develop more accurate and robust building polygon extraction methods to address the challenges of near-horizon and off-horizon remote sensing images. The dataset provides high-quality prior information and maintains the consistency of building structures, which is of great significance for improving the accuracy of building polygon extraction.
提供机构:
中国科学院电子电气与通信工程学院,中国香港城市大学数据科学系,武汉大学人工智能学院,中国科学院航空航天信息研究院,中国香港城市大学数据科学系
创建时间:
2025-09-23
搜集汇总
数据集介绍

构建方式
ReBO数据集的构建依托于地理空间数据与遥感影像的深度融合,其核心方法是通过整合来自OpenStreetMap的历史建筑标签与高分辨率遥感图像。研究团队从Google Earth获取空间分辨率为0.5米的遥感影像,覆盖41个城市的5473张图像,包含近天底与偏天底两种视角。每张图像对应的OpenStreetMap建筑多边形由专业标注人员手动对齐至影像中的实际建筑轮廓,生成精确的屋顶与基底多边形标签,并计算其间的位移偏移量,最终形成包含179,265个建筑实例的标准化数据集。
特点
该数据集在建筑多边形提取领域具有显著的多视角与多尺度特性,其影像同时涵盖近天底与偏天底视角,能够有效模拟真实场景中因拍摄角度导致的屋顶与基底位移问题。数据集不仅提供原始的OpenStreetMap标签,还包含经人工校正的屋顶与基底多边形,以及三者间的几何偏移向量,为研究建筑投影差异与结构对应关系提供了丰富注释。其地理分布横跨六大洲的22个国家,建筑风格多样,对模型的泛化能力提出了较高要求。
使用方法
ReBO数据集主要用于训练与评估基于历史标签对齐的建筑多边形提取模型。研究人员可将OpenStreetMap标签与对应遥感图像作为输入,通过模型学习标签与真实建筑位置间的校正向量,实现屋顶与基底多边形的精确提取。数据集支持迭代式去噪训练策略,即在训练阶段通过高斯扰动模拟标签位移,引导模型逐步修正位置误差;在推理阶段,则可利用多步对齐机制逐步优化预测结果。该设计尤其适用于处理偏天底影像中因建筑高度差异导致的非均匀位移问题。
背景与挑战
背景概述
ReBO(Repairing Buildings in OpenStreetMap)数据集于2025年由武汉大学、中国科学院大学及香港城市大学联合团队构建,旨在解决倾斜遥感影像中建筑物屋顶与足迹的多边形提取难题。该数据集涵盖41个城市、5473张高分辨率遥感图像,包含179,265个建筑实例,并融合了OpenStreetMap的历史标注与人工精校的真值多边形。其核心研究价值在于将建筑多边形提取重构为历史标签与影像的对齐问题,为地理信息学领域提供了首个专用于偏移标注修正的大规模基准。
当前挑战
ReBO数据集主要应对倾斜视角下建筑物屋顶与足迹的空间位移挑战,其构建需克服两大难点:一是历史标签与影像间存在复杂的位置偏差,源于地理配准误差与众包标注的主观性;二是倾斜影像中屋顶与立面像素语义边界模糊,导致传统分割模型难以准确提取足迹轮廓。数据集成过程中,需通过高斯扰动模拟真实误对齐情况,并设计两阶段对齐机制(标签至足迹、足迹至屋顶)以保障标注质量。
常用场景
经典使用场景
ReBO数据集在建筑多边形提取研究中具有典型应用价值,尤其在处理倾斜视角遥感图像时展现出独特优势。该数据集通过提供OpenStreetMap历史标注与人工校正后的屋顶和足迹多边形,为模型训练提供了丰富的对齐样本。其经典使用场景体现在利用地理配准的遥感图像与矢量标注之间的位置校正,特别是在建筑高度差异显著的密集城区,能够有效模拟真实世界中因拍摄角度和地理参考误差导致的标注偏移问题。
解决学术问题
ReBO数据集主要解决了倾斜视角遥感图像中建筑屋顶与足迹提取的学术难题。传统方法在近垂直图像中假设屋顶与足迹重叠的几何关系,但这一假设在倾斜视角下因投影视差而失效。该数据集通过提供明确的偏移向量标注,使研究者能够建模高度相关的位移关系,从而突破语义分割方法在立面像素干扰下的局限性。其意义在于首次系统性地建立了历史标注与多视角图像的对应关系,为几何驱动的新型建筑提取范式提供了数据基础。
衍生相关工作
围绕ReBO数据集衍生出多项创新性研究,其中最具代表性的是DragOSM框架提出的对齐令牌机制。该工作将标注对齐问题重构为基于高斯分布的去噪过程,通过迭代修正策略处理大范围位移误差。后续研究在此基础上发展了测试时增强策略,如DragOSM-t1通过添加扰动生成多组局部最优解,DragOSM-t1.5则利用收敛后步骤的输出提升稳定性。这些工作共同推动了基于历史标注的建筑提取范式从静态匹配向动态交互的转变,为矢量地图更新提供了新的技术路径。
以上内容由遇见数据集搜集并总结生成



