five

Embedding Tiles

收藏
github2026-03-17 更新2026-03-16 收录
下载链接:
https://github.com/zephr-xyz/embedding-tiles
下载链接
链接失效反馈
官方服务:
资源简介:
Overture POI嵌入瓦片,用于科罗拉多州博尔德县。提供768维EmbeddingGemma向量、来自街景图像的视觉描述和Mapillary图像链接的Protobuf + JSON瓦片,基于z14 web mercator网格。包含两个数据集:完整数据集(12,406个POI)和仅视觉数据集(2,245个POI)。

Overture POI Embedding Tiles for Boulder County, Colorado. This dataset provides Protobuf and JSON tiles based on the z14 web mercator grid, which contain 768-dimensional EmbeddingGemma vectors, visual descriptions derived from street-view images, and Mapillary image links. It includes two datasets: the full dataset (12,406 POIs) and the visual-only dataset (2,245 POIs).
创建时间:
2026-03-13
原始信息汇总

Embedding Tiles 数据集概述

数据集简介

本数据集为美国科罗拉多州博尔德县的Overture兴趣点(POI)嵌入瓦片。数据以Protobuf和JSON格式提供,基于z14 Web墨卡托网格,包含768维EmbeddingGemma向量、来自街景图像的视觉描述以及Mapillary图像链接。

数据集构成

提供了两个子数据集:

数据集名称 存储路径 POI数量 描述
完整数据集 embedding-tiles-overture/z14/ 12,406 博尔德县所有带有嵌入向量的Overture POI
仅视觉数据集 embedding-tiles-overture-visual/z14/ 2,245 拥有来自Mapillary街景图像视觉描述的POI

每个瓦片提供两种格式:.pb(Protobuf,紧凑格式)和.json(人类可读格式)。

数据访问

瓦片公开托管在S3上,可直接获取:

完整数据集:

https://zephrpoint-public-models.s3.us-east-2.amazonaws.com/embedding-tiles-overture/z14/x{X}_y{Y}.pb https://zephrpoint-public-models.s3.us-east-2.amazonaws.com/embedding-tiles-overture/z14/x{X}_y{Y}.json

仅视觉数据集:

https://zephrpoint-public-models.s3.us-east-2.amazonaws.com/embedding-tiles-overture-visual/z14/x{X}_y{Y}.pb https://zephrpoint-public-models.s3.us-east-2.amazonaws.com/embedding-tiles-overture-visual/z14/x{X}_y{Y}.json

瓦片格式

瓦片网格

瓦片遵循标准的z14 Web墨卡托(滑动地图)切片方案。每个瓦片文件名编码其网格位置:x{X}_y{Y}.pb

数据模式

瓦片数据遵循Protobuf模式,主要包含WaypointTile消息,其中包含重复的Waypoint消息。每个Waypoint包含以下关键字段:

字段 编号 类型 描述
id 1 string UUID标识符
name 2 string POI名称
latitude 3 double WGS84纬度
longitude 4 double WGS84经度
description 5 string Overture POI描述
embedding 8 repeated float 768维EmbeddingGemma文档嵌入向量
embedding_document 9 string 用于生成文档嵌入的源文本
types 11 string Overture POI类型类别
visual_description 14 string 基于街景图像的AI生成描述
visual_embedding 15 repeated float 768维EmbeddingGemma视觉嵌入向量
enclosing_roads 16 repeated RoadSegment 相邻道路段
phone 17 string 电话号码
address 18 string 街道地址
entrance_lat 20 double 入口纬度(面向道路的立面中点)
entrance_lon 21 double 入口经度
mapillary_ids 22 repeated string 经过质量检查的Mapillary街景图像ID
website 23 string 网站URL
overture_building_id 24 string Overture Maps建筑特征ID

JSON格式文件镜像了Protobuf瓦片的结构。

嵌入向量

两个嵌入向量字段均使用EmbeddingGemma(768维):

  • embedding(字段8)— 从embedding_document(字段9)生成的文档嵌入向量,该文本结合了POI名称、类型和描述,形成可搜索的文本表示。
  • visual_embedding(字段15)— 从visual_description(字段14)生成的视觉嵌入向量,该描述基于Mapillary街景图像描述了POI的物理外观。

仅视觉数据集仅包含visual_description(字段14)有值的POI。

数据集统计

完整数据集 (embedding-tiles-overture/)

指标 数量
总瓦片数 575
总POI数 12,406
拥有文档嵌入向量(768维) 12,406
拥有embedding_document 12,406
拥有visual_description 2,245
拥有视觉嵌入向量(768维) 2,245
拥有mapillary_ids 4,246
拥有入口坐标 12,406
拥有enclosing_roads 11,898

仅视觉数据集 (embedding-tiles-overture-visual/)

指标 数量
总瓦片数 575(227个非空)
总POI数 2,245
拥有文档嵌入向量(768维) 2,245
拥有visual_description 2,245
拥有视觉嵌入向量(768维) 2,245
拥有mapillary_ids 1,852

数据来源

瓦片数据结合了多个来源:

  • Overture Maps — 基础POI数据(名称、位置、类型、地址、建筑轮廓)
  • Mapillary — 街景图像
  • EmbeddingGemma — 用于语义搜索的768维嵌入向量
  • 建筑几何 — 根据Overture建筑轮廓和道路段计算出的入口坐标

地理覆盖范围

瓦片覆盖美国科罗拉多州博尔德县(边界框:北纬39.89°至40.28°,西经-105.58°至-105.03°)。

许可证

本数据衍生自Overture Maps(ODbL)和Mapillary(CC BY-SA)。嵌入向量和视觉描述由zephr-maps流水线生成。

搜集汇总
数据集介绍
main_image_url
构建方式
在空间信息科学领域,数据集的构建往往依赖于多源异构数据的融合与标准化处理。Embedding Tiles数据集的构建过程体现了这一理念,其核心是将Overture Maps提供的基础兴趣点数据与Mapillary的街景图像信息进行深度整合。具体而言,数据集以科罗拉多州博尔德县为地理范围,采用标准的z14网络墨卡托切片网格进行空间组织,将12,406个兴趣点分布到575个空间切片中。每个兴趣点不仅包含名称、坐标、地址等基础属性,还通过EmbeddingGemma模型生成了768维的文本嵌入向量,并针对具备街景图像的兴趣点额外生成了视觉描述文本及其对应的视觉嵌入向量。这种构建方式确保了数据在空间分布上的规整性,同时通过嵌入向量为语义检索提供了技术支持。
特点
该数据集最显著的特点在于其多维度的信息表征与精细化的空间组织。数据集提供了完整版与仅视觉版两个子集,分别包含全部兴趣点与仅具备视觉描述的兴趣点,满足了不同研究场景的需求。每个兴趣点条目结构丰富,不仅包含地理坐标、分类、地址等传统属性,还创新性地引入了基于文本描述的文档嵌入向量和基于街景图像的视觉嵌入向量,这为跨模态的地理信息检索与分析提供了可能。数据以Protobuf和JSON两种格式提供,兼顾了存储效率与人类可读性。此外,数据集还计算了每个兴趣点面向道路的入口坐标,并关联了经过质量验证的Mapillary图像ID,增强了数据的实用价值与可解释性。
使用方法
对于地理信息科学和机器学习领域的研究者而言,该数据集的使用方法灵活且高效。用户可以通过公开的S3存储直接获取指定坐标的切片数据,支持通过简单的HTTP请求或命令行工具如curl进行下载。数据集遵循标准的网络墨卡托切片方案,提供了经纬度坐标到切片网格坐标的转换函数,便于用户精准定位所需的地理区域。在数据处理层面,用户可以选择解析紧凑的Protobuf格式以优化存储和传输,或直接读取结构清晰的JSON格式进行快速原型开发。随数据提供的Python和JavaScript代码示例,展示了如何加载切片、遍历兴趣点并访问其丰富的属性字段,特别是如何利用文本与视觉嵌入向量进行后续的语义相似度计算或可视化分析,为位置智能应用提供了坚实的数据基础。
背景与挑战
背景概述
在空间数据科学和地理信息系统领域,兴趣点数据的语义化表示与多模态融合正成为前沿研究方向。Embedding Tiles数据集由Zephr机构于近期构建,其核心研究问题在于如何将传统的POI地理信息与先进的文本及视觉嵌入向量相结合,以支持基于语义的地理空间搜索与分析。该数据集整合了Overture Maps的基础POI数据、Mapillary的街景图像以及EmbeddingGemma生成的768维嵌入向量,为科罗拉多州博尔德县提供了包含12,406个POI的丰富多模态地理数据集。通过将地理位置、文本描述和视觉特征编码为统一的向量空间,该数据集有力推动了地理信息检索、智能导航和城市计算等领域向语义理解层面的深化发展。
当前挑战
该数据集旨在解决地理空间信息检索中语义鸿沟的挑战,即传统基于关键词或坐标的搜索难以理解用户查询的深层意图与上下文。具体而言,其挑战体现在将非结构化的多源异构数据(如文本描述、街景图像、几何图形)融合并编码为可计算的语义向量,同时确保地理空间拓扑关系的保留。在构建过程中,挑战主要集中于数据对齐与质量保障:需要精确计算POI的入口坐标以关联建筑足迹与道路网络,并对Mapillary街景图像进行质量验证以生成可靠的视觉描述。此外,在z14级别的网络墨卡托瓦片上组织大规模嵌入向量,并保持Protobuf与JSON格式的数据一致性与高效访问,亦构成了显著的技术复杂性。
常用场景
经典使用场景
在空间信息科学领域,Embedding Tiles数据集为地理空间智能研究提供了多模态融合的基准数据。其经典使用场景在于支持基于语义嵌入的地理实体检索与相似性分析,研究者能够利用768维的EmbeddingGemma向量,对科罗拉多州博尔德县的兴趣点进行跨模态匹配。通过整合文档嵌入与视觉嵌入,该数据集使得学术工作能够探索文本描述与街景图像在空间语义理解中的协同作用,为构建智能地理信息系统奠定数据基础。
解决学术问题
该数据集有效解决了地理信息系统中多源数据融合与语义理解的学术难题。通过将Overture地图的POI属性、Mapillary街景图像的视觉描述以及EmbeddingGemma生成的语义向量统一于标准化网格瓦片,研究者能够克服传统地理数据中文本与视觉信息割裂的局限。其意义在于推动了空间人工智能领域的发展,为地理位置推荐、城市景观分析等研究提供了高精度、多模态的基准数据,促进了跨学科方法的创新。
衍生相关工作
围绕Embedding Tiles数据集,已衍生出多项经典研究工作。例如,基于其多模态嵌入特征的空间语义搜索系统,能够实现跨文本与图像的混合检索;利用视觉嵌入的街景景观分类模型,提升了城市环境感知的自动化水平。此外,结合入口坐标与道路数据的研究,推动了微观尺度行人导航算法的优化。这些工作共同拓展了地理人工智能的边界,为后续的时空预测与场景理解研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作