five

SinoBF-1

收藏
github2025-12-09 更新2025-12-13 收录
下载链接:
https://github.com/LiZhuoHong/SinoBF-1
下载链接
链接失效反馈
官方服务:
资源简介:
本研究提供了一个中国建筑级别的功能地图,覆盖了109个城市的1.1亿个独立建筑,使用了69TB的多模态卫星影像。全国范围的地图通过政府报告和5,280,695个观测点进行了验证,显示出与外部基准的强一致性。这使得能够在全国范围内对城市等级、地理区域和城市内区域的不平等进行多维评估。

This study presents a building-level functional map of China, covering 110 million individual buildings across 109 cities and constructed using 69 TB of multimodal satellite imagery. The nationwide map was validated against government reports and 5,280,695 observational points, demonstrating strong consistency with external benchmarks. This enables multidimensional assessments of urban inequality across city tiers, geographic regions, and intra-urban areas at the national scale.
创建时间:
2025-12-08
原始信息汇总

SinoBF-1 数据集概述

数据集基本信息

  • 数据集名称: SinoBF-1: the national-scale building-level functional map of urban China
  • 核心内容: 中国城市建筑级别的功能地图
  • 覆盖范围: 中国109个城市
  • 数据规模: 包含1.1亿栋独立建筑
  • 数据格式: ESRI Shapefile格式(包含“.cpg”、“.dbf”、“.shx”、“.shp”和“.prj”文件),存储在“.zip”压缩文件中
  • 文件命名规则: 每个城市文件命名为“G_P_C.zip”,其中“G”代表地理区域,“P”代表省级行政区,“C”代表城市名称
  • 数据发布地址: https://doi.org/10.5281/zenodo.17844789

数据来源与验证

  • 主要数据源: 69TB多模态卫星影像
  • 验证数据:
    • 政府报告
    • 5,280,695个观测点
  • 外部基准对比: 显示与外部基准高度一致

原始数据与标签来源

  • 光学影像: 1米分辨率Google Earth光学影像(https://earth.google.com)
  • 夜间灯光数据: 10米分辨率夜间灯光数据(SGDSAT-1)(https://sdg.casearth.cn/en)
  • 建筑高度数据: 建筑高度数据(CNBH-10m)(https://zenodo.org/records/7827315)
  • 建筑足迹数据:
    • CN-OpenData(https://doi.org/10.11888/Geogra.tpdc.271702)
    • East Asia Building Dataset(https://zenodo.org/records/8174931)
  • 土地利用与兴趣点数据:
    • OpenStreetMap(https://www.openstreetmap.org)
    • EULUC-China数据集(https://doi.org/10.1016/j.scib.2019.12.007)
  • 土地覆盖图: 首张1米分辨率全国尺度土地覆盖图(SinoLC-1)(https://doi.org/10.5281/zenodo.7707461)
  • 人口数据: 基于中国第七次人口普查的100米网格化人口数据集(https://figshare.com/s/d9dd5f9bb1a7f4fd3734?file=43847643)

多维建成环境分析维度与指标

城市化强度

  • 指标:
    • 建筑高度
    • 建筑密度
    • 夜间灯光强度
  • 数据来源: 直接来源于外部数据源:建筑高度数据(CNBH-10m)和10米夜间灯光数据(SGDSAT-1)

设施可达性

  • 指标:
    • 医疗资源可达性
    • 教育资源可达性
    • 公共服务资源可达性
  • 测量方法: 通过计算从居住建筑到每类设施的平均最短出行时间
  • 处理脚本目录: ./access_process

基础设施充足性

  • 指标:
    • 邻里便利设施多样性
    • 居住容量分配不平等性
    • 人均基础设施占用率
  • 测量方法:
    • 邻里便利设施多样性:衡量每个居住地15分钟邻里圈内便利设施的多样性和可用性
    • 居住容量分配不平等性:使用基尼系数量化
    • 人均基础设施占用率:评估基础设施供应与人口规模的关系
  • 处理脚本目录: ./availability_diversity_process./inequal_allocation_process/result

建筑功能制图流程

01 语义分割模型(Paraformer)训练

  • 训练列表: 提供109个城市的原始训练列表,位于 ./Building_mapping_01_semantic_segmentation/All_109_cities_trainlists/ 目录
  • 预训练模型: ImageNet21k ViT预训练模型(https://drive.google.com/file/d/10Ao75MEBlZYADkrXE4YLg6VObvR0b2Dr/view?usp=sharing)
  • 示例训练数据: Jiaxing市处理后的训练数据集(约80GB/城市)(https://duke.box.com/shared/static/y5f0w731z7lf2rozdjd77pj0vopeizg7.zip)

02 基于目标分类模型(Mask RCNN)的后处理

  • 输入数据: 与语义分割训练相同的数据集
  • 最终结果保存目录: ./Building_mapping_02_post_processing/result

示例数据集

  • 示例城市: Jiaxing City
  • 下载地址: https://duke.box.com/s/hjnwgccyzo13ha4u4d82k6ye41qxo3sz
  • 存放目录: ./input_data

依赖安装

  • 分析过程依赖: 执行任何Python文件前运行 pip install -r requirements_analysis.txt
  • 分割模型依赖: 执行任何Python文件前运行 pip install -r requirements_segmentation.txt

联系人

  • 联系人: Zhuohong Li
  • 邮箱: ashelee@whu.edu.cn
  • 个人主页: https://lizhuohong.github.io/lzh/
搜集汇总
数据集介绍
main_image_url
构建方式
在遥感与城市地理信息科学领域,SinoBF-1数据集的构建体现了多源数据融合与深度学习技术的深度整合。该数据集通过整合69TB的多模态卫星影像,包括1米分辨率的谷歌地球光学影像、10米夜间灯光数据以及建筑高度数据,并结合开放街道地图与中国土地利用数据集,构建了覆盖中国109个城市、总计1.1亿栋建筑的精细功能标注。其核心流程采用Paraformer语义分割模型进行初步建筑提取,再通过Mask RCNN对象分类模型进行后处理与功能重分类,最终形成以ESRI Shapefile格式存储的建筑级功能地图,并经过政府报告与528万观测点的严格验证,确保了数据的科学性与可靠性。
特点
SinoBF-1数据集作为国家尺度的建筑功能地图,其突出特点在于前所未有的覆盖广度与精细度。数据集不仅提供了每栋建筑的功能类别,还集成了多维建成环境分析指标,涵盖城市化强度、设施可达性与基础设施充足性三大维度。具体而言,城市化强度通过建筑高度、密度及夜间灯光强度直接量化;设施可达性基于最小通行时间计算医疗、教育与公共服务资源的邻近度;基础设施充足性则通过邻里便利设施多样性、居住容量分配不平等性及人均基础设施占用等指标进行刻画。这些结构化指标为深入探究城市内部及区域间的建成环境差异提供了全面、可计算的数据基础。
使用方法
该数据集的使用遵循模块化与可复现的分析框架。用户可从Zenodo平台获取完整的建筑功能地图产品,并以ESRI Shapefile格式进行地理信息系统的加载与可视化。对于多维建成环境分析,配套的Python脚本库支持设施可达性、邻里便利设施多样性及居住容量不平等性等指标的计算。具体操作需预先配置Python环境并安装依赖包,随后按步骤执行各分析模块的脚本,例如通过OSM路网与土地覆盖数据生成成本栅格,进而计算建筑至各类设施的最短通行时间。用户还可基于提供的训练流程,利用Paraformer与Mask RCNN模型对其他城市进行建筑功能映射的扩展应用,实现分析过程的高度自定义与可扩展性。
背景与挑战
背景概述
SinoBF-1数据集作为中国首个全国尺度的建筑级功能地图,由杜克大学、武汉大学等机构的研究团队于近期构建,旨在通过多模态卫星影像技术,精细刻画中国109个城市中1.1亿栋建筑的功能属性。该数据集的核心研究问题聚焦于揭示城市建成环境的多维不平等现象,通过整合高分辨率光学影像、夜间灯光及建筑高度等多源数据,为城市规划、社会公平及可持续发展研究提供了前所未有的微观尺度分析基础。其创新性在于将遥感大数据与城市功能语义相结合,推动了地理信息科学在城市精细化治理领域的应用深度与广度。
当前挑战
SinoBF-1数据集致力于解决城市建筑功能自动分类与建成环境不平等量化这一复杂领域问题,面临多重挑战:在领域层面,需克服建筑功能语义的模糊性与地域异质性,例如商业、居住与混合功能建筑的边界界定;同时,大规模城市系统的多维不平等评估需融合空间统计与社会经济指标,对模型的可解释性与稳健性提出更高要求。在构建过程中,处理69TB多源卫星影像涉及海量数据存储与计算效率问题;跨区域建筑标注的标准化与验证需协调政府报告与数百万观测点,确保数据的一致性与权威性;此外,融合异构数据源(如OpenStreetMap与人口普查数据)时,时空分辨率与坐标系统的对齐亦是技术难点。
常用场景
经典使用场景
在城市化与地理信息科学领域,SinoBF-1数据集以其覆盖中国109个城市、1.1亿栋建筑的精细功能标注,成为研究城市建成环境空间格局的经典工具。该数据集通过整合多模态卫星影像与开放地理数据,实现了建筑级别的功能分类,如住宅、商业、公共服务等,为学者提供了前所未有的高分辨率城市功能图谱。其典型应用场景包括城市形态分析、功能分区识别以及建成环境质量评估,尤其适用于跨城市比较与时空演变研究,为理解中国快速城市化进程中的空间组织规律提供了数据基础。
衍生相关工作
基于SinoBF-1数据集,学术界已衍生出多项经典研究工作。例如,结合建筑功能与人口数据的研究揭示了不同城市层级间基础设施分配的不平等模式,相关成果发表于城市科学与地理信息领域顶级期刊。另有研究利用该数据集开发了新的城市功能混合度计算模型,提升了城市活力评估的精度。此外,数据集还被用于验证与改进深度学习模型在城市遥感解译中的性能,推动了Paraformer等语义分割算法在建筑功能识别任务中的应用。这些衍生工作不仅拓展了数据集的使用边界,也促进了跨学科方法在城市研究中的融合与创新。
数据集最近研究
最新研究方向
在城市化与可持续发展研究领域,SinoBF-1数据集作为全国尺度的建筑功能地图,正推动城市建成环境分析的前沿探索。当前研究聚焦于利用其高分辨率建筑功能数据,结合多模态卫星影像,深入量化城市内部设施可达性、邻里便利性多样性以及居住容量分配的不平等性。这些分析不仅揭示了不同城市层级、地理区域和城市内部区域间的深层建成环境差异,还与人口普查数据相结合,为评估基础设施配置的公平性提供了科学依据。该数据集的应用正促进智慧城市规划和公共政策制定,成为理解中国城市化进程中空间不平等现象的关键工具,具有重要的学术价值与社会意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作