five

HighBuild-1M

收藏
Hugging Face2026-05-03 更新2026-05-04 收录
下载链接:
https://huggingface.co/datasets/feifei140729/HighBuild-1M
下载链接
链接失效反馈
官方服务:
资源简介:
HighBuild-1M是一个多大陆高分辨率基准数据集,专为从航拍图像进行单视角建筑高度估计而设计。每个样本包含一个1024×1024的RGB航拍图像、一个空间对齐的float32建筑高度掩码以及COCO风格的建筑实例标注。数据集覆盖6大洲、12个国家或地区、26个城市群,共包含70,266个配对的1024×1024图像块和6,050,823个建筑实例。数据集支持多种任务,包括单视角建筑高度估计、建筑分割和实例级建筑理解,以及空间泛化基准测试。数据以WebDataset TAR分片形式分发,每个样本包含JPEG图像、TIFF掩码和JSON标注文件。数据集适用于地理空间计算机视觉模型的训练和评估,但需注意其覆盖范围不均和来源多样化的特点。

HighBuild-1M is a multi-continent high-resolution benchmark dataset designed for single-view building height estimation from aerial images. Each sample contains a 1024×1024 RGB aerial image, a spatially aligned float32 building height mask, and COCO-style building instance annotations. The dataset covers 6 continents, 12 countries or regions, and 26 urban areas, totaling 70,266 paired 1024×1024 image tiles and 6,050,823 building instances. It supports multiple tasks including single-view building height estimation, building segmentation, instance-level building understanding, and spatial generalization benchmarking. The data is distributed in WebDataset TAR shards, with each sample containing JPEG images, TIFF masks, and JSON annotation files. The dataset is suitable for training and evaluating geospatial computer vision models, but note its uneven coverage and diverse sources.
创建时间:
2026-05-03
原始信息汇总

HighBuild-1M 数据集详情

数据集概述

HighBuild-1M 是一个面向单视角建筑物高度估计的多大陆高分辨率基准数据集。每个样本包含一张 1024×1024 的 RGB 遥感影像、一张空间对齐的 float32 建筑物高度掩码图,以及 COCO 格式的建筑物实例标注。

数据集规模

指标 数值
1024×1024 瓦片数 70,266
建筑物实例数 6,050,823
城市群组数 26
国家/地区数 12
大洲数 6

数据集覆盖 6 个大洲、12 个国家或地区、26 个城市群组,包含 70,266 对 1024×1024 瓦片和 6,050,823 个建筑物实例。

支持的任务

  1. 单视角建筑物高度估计:输入为 1024×1024 RGB 遥感影像,输出为空间对齐的 float32 建筑物高度图。
  2. 建筑物级高度评估:可在 COCO 格式的建筑物多边形内聚合预测高度图,计算建筑物级的 MAE/RMSE。
  3. 建筑物分割/实例级理解:使用 COCO 格式的建筑物多边形和边界框进行语义或实例级分析。
  4. 空间泛化基准测试:支持同城市、国内跨城市、跨国家三种评估协议。

数据集结构

原始未分片布局下,每个样本由三个匹配文件组成:

  • data/images/<大洲>_<国家>_<城市>/<瓦片ID>.jpg
  • data/masks/<大洲>_<国家>_<城市>/masks/<瓦片ID>.tiff
  • data/annotations/coco_json/<大洲>_<国家>_<城市>/<瓦片ID>.json

基准元数据文件包括:

  • benchmark_v1/manifest_tiles_1024.csv
  • benchmark_v1/manifest_patches_256.csv
  • benchmark_v1/city_coverage.csv
  • benchmark_v1/split_report.md
  • benchmark_v1/splits/random_64_16_20/tiles_1024/{train,val,test}.txt
  • benchmark_v1/splits/random_64_16_20/patches_256/{train,val,test}.txt

托管版本使用 WebDataset TAR 分片格式,存放在 data/webdataset/train/*.tardata/webdataset/validation/*.tardata/webdataset/test/*.tar 路径。

包含的城市

文件夹 瓦片数
Africa_SouthAfrica_CapeTown 5,473
Asia_Japan_Osaka 1,554
Europe_Denmark_Aarhus 95
Europe_Denmark_Copenhagen 1,618
Europe_Denmark_Odense 90
Europe_France_Lyon 101
Europe_France_Marseille 159
Europe_France_Paris 6,294
Europe_France_Strasbourg 94
Europe_France_Toulouse 231
Europe_Germany_Berlin 10,355
Europe_Germany_Frankfurt 99
Europe_Germany_Munich 108
Europe_Netherlands_Amsterdam 1,836
NorthAmerica_Canada_Toronto 8,471
NorthAmerica_Canada_Vancouver 126
NorthAmerica_USA_Chicago 120
NorthAmerica_USA_LosAngeles 123
NorthAmerica_USA_NewYork 11,172
NorthAmerica_USA_SanFrancisco 87
NorthAmerica_USA_Seattle 78
Oceania_Australia_Melbourne 602
Oceania_Australia_Sydney 138
SouthAmerica_Brazil_SaoPaulo 12,191

数据划分(random_64_16_20)

划分 1024 瓦片数 256 分块数 比例
训练集 39,178 626,848 64%
验证集 9,794 156,704 16%
测试集 12,243 195,888 20%

托管版本共 61,215 个 1024×1024 瓦片。所有 256×256 分块继承其父瓦片的划分,避免训练、验证、测试集之间的信息泄露。

数据字段

  • image:JPEG 格式的 RGB 影像瓦片。
  • mask:与影像瓦片对齐的 TIFF 栅格掩码,像素值编码建筑物高度目标。
  • annotation:COCO 格式的 JSON 标注文件,记录瓦片内建筑物信息。
  • manifest_tiles_1024.csv:每个完整影像-掩码-标注组合一行。
  • manifest_patches_256.csv:每个从 1024 瓦片网格导出的 256×256 分块一行。

许可与归属

本数据集为多源地理空间数据集,影像和建筑物高度标签来源于具有不同许可和归属要求的公共或授权区域来源。详情请参考 LICENSES.md 文件。

预期用途

  • 单图像建筑物高度估计基准测试
  • 地理空间计算机视觉模型训练与评估
  • 跨城市、跨国家、跨大洲泛化能力研究
  • 城市形态与建成环境遥感研究

非预期用途

本数据集不应单独用于法律、安全关键、房地产、保险、税务、应急响应或基础设施决策,也不应用于推断个人或家庭敏感属性。

局限性

  • 各大洲、国家和城市间的覆盖不均衡。
  • 源影像日期与建筑物高度标签日期可能不完全匹配。
  • 不同源区域的空间分辨率、采集条件、传感器特性和建筑物高度定义存在差异。
  • 部分密集城区瓦片数量占主导。
  • 当前的 random_64_16_20 划分基于 1024 瓦片级别的随机划分,并非严格的地理留出划分。

引用

bibtex @misc{highbuild1m2026, title={HighBuild-1M: A Multi-Continental High-Resolution Benchmark Dataset for Single-View Building Height Estimation and Instance Segmentation}, author={Anonymous}, year={2026}, note={Submitted to NeurIPS 2026 Evaluations and Datasets Track} }

搜集汇总
数据集介绍
main_image_url
构建方式
HighBuild-1M源自多洲际高分辨率遥感影像与建筑高度标签的精心整合。其构建流程始于对全球12个国家或地区、26个城市群、总计70,266幅1024×1024像素RGB航拍影像及其对应的浮点型建筑高度掩膜与COCO格式实例标注的采集与对齐。为优化存储与传输,数据集采用WebDataset TAR分片格式进行分发,每个分片内的掩膜TIFF文件通过内部ZSTD无损压缩(压缩级别9、预测器3、分块512×512)显著缩减体积,而RGB JPEG图像与JSON标注则保持原有编码。最终形成训练、验证、测试三个分片集合,分别占比64%、16%与20%,确保样本间无泄漏。
特点
该数据集的核心特色在于其跨越六大洲的广泛地理覆盖与高空间分辨率(1024×1024像素),涵盖6,050,823个建筑实例,为单视角建筑高度估计提供了前所未有的多样性基准。每个样本同时包含RGB图像、对齐的高度掩膜与建筑实例多边形,支持高度估计、语义分割、实例级分析及空间泛化基准测试多元任务。掩膜采用浮点32位精度,经由TIFF内部ZSTD压缩后平均体积从4.2 MB骤降至约27 KB,兼顾数据完整性与传输效率。此外,数据集提供了同城、跨城、跨国等多种评估协议,便于系统研究模型的空间泛化能力。
使用方法
用户可通过Hugging Face Datasets库以流式方式加载WebDataset分片,例如使用`load_dataset('webdataset', data_files=data_files, streaming=True)`,按需读取训练、验证与测试集。单个分片也可通过标准tar命令解压至本地目录。掩膜文件可利用支持ZSTD解码的GDAL或rasterio库直接读取像素数组,无需手动解压;若需兼容旧工具,可通过`gdal_translate`转换为无压缩TIFF格式。数据字段包括JPEG图像、TIFF掩膜与COCO JSON标注文件,便于集成至常见深度学习框架,如PyTorch或TensorFlow,进行模型训练与评估。
背景与挑战
背景概述
HighBuild-1M数据集由匿名研究团队于2026年创建,旨在应对遥感领域单视角建筑高度估计这一核心问题。该数据集覆盖六大洲、12个国家和地区及26个城市群,包含70,266张1024×1024分辨率的RGB遥感图像、精确对齐的浮点型建筑高度掩膜及COCO格式的实例标注,总计超过600万栋建筑实例。其多洲际、跨城市的空间分布特性为研究建筑高度估计模型的空间泛化能力提供了前所未有的基准,对推动地球观测、城市形态分析与地理空间计算机视觉的发展具有重要影响。
当前挑战
该数据集面临双重挑战。领域层面,单视角建筑高度估计需从二维图像中恢复三维结构,受影像采集条件、传感器特性及建筑形态差异影响,模型难以在跨城市或跨洲场景中保持鲁棒性。构建层面,数据来源涉及多国公共与授权数据,存在影像时相与标签时间不匹配、空间分辨率不均匀及建筑高度定义不一致的问题;同时,密集城区的样本分布极不均衡(如圣保罗与纽约占据了显著比例),且数据集的正式发布版本采用随机分割而非严格的地理隔离划分,增加了评估模型泛化能力的复杂性。
常用场景
经典使用场景
HighBuild-1M数据集最经典的使用场景聚焦于基于单幅遥感影像的建筑高度估计任务。该数据集提供了来自六大洲12个国家26个城市群的高分辨率RGB影像,每张影像均附带像素级浮点建筑高度掩膜和COCO格式的建筑实例标注。研究者可输入单一1024×1024像素的遥感图块,通过深度学习模型直接回归生成空间对齐的连续高度图,进而实现建筑尺度的精准高度预测。该场景是遥感领域从二维语义理解迈向三维空间感知的核心枢纽,为城市形态定量分析和三维重建提供了高质量的数据支撑。
实际应用
在实际应用层面,HighBuild-1M可服务于城市规划、灾害应急和智慧城市建设等关键领域。例如,通过快速估算城市建筑高度分布,辅助城市三维模型更新与容积率评估,降低传统测绘图成本。在台风或地震等自然灾害发生后,结合灾前与灾后影像的高度变化差异,实现对建筑损毁程度的自动化初判,为救援资源调度提供及时决策依据。此外,该数据集支撑的模型还可用于光伏潜能评估、无线通信基站布设等需要建筑高度信息的商业场景,展现出从遥感数据到社会价值的直接转化潜力。
衍生相关工作
围绕HighBuild-1M衍生出的一系列经典工作主要集中在研究跨区域泛化的建筑高度估计架构上。典型方向包括设计结合多尺度特征融合与空间注意力机制的深度网络,以应对不同城市建筑密度和屋顶结构的差异性;以及探索自监督预训练策略,利用该数据集的丰富标注进行领域自适应迁移学习。此外,部分工作将其与建筑实例分割结合,衍生出联合高度回归与语义掩膜的多任务学习范式,提升了建筑轮廓与高度估计的一致精度。这些衍生研究共同推动了遥感三维信息提取技术的系统性进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作