five

Qdrant/google-landmark-geo

收藏
Hugging Face2023-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Qdrant/google-landmark-geo
下载链接
链接失效反馈
官方服务:
资源简介:
Geo Coordinate Augmented Google-Landmarks数据集是从Google Landmark V2数据集中提取的图像数据,并添加了地理坐标信息。由于部分图像在wikimedia页面上缺乏坐标,因此并非所有图像都能进行地理标记。该数据集的主要用途是展示在Qdrant中使用地理过滤器进行图像相似性搜索。数据集包含一个原始地理标记文件train_attribution_geo.json和一个包含图像嵌入向量的json文件id_payload_vector.json。图像嵌入是使用Thingsvision库中的CLIP模型(ViT-B/32变体)生成的。数据集和代码的许可证与原始Google Landmarks V2数据集相同,均为CC BY 4.0。
提供机构:
Qdrant
原始信息汇总

数据集卡片 for Geo Coordinate Augmented Google-Landmarks

数据集详情

数据集描述

地理坐标被添加到来自Google Landmark V2的图像的tar文件中。由于图像的维基媒体页面缺少坐标,并非所有图像都能进行地理标记。

该数据集旨在展示在Qdrant中使用地理过滤器与图像相似性搜索的结合。

我们提供原始的地理标记文件作为geojson文档,即train_attribution_geo.json。我们还提供了一个包含上述数据以及图像嵌入向量的json文件,即id_payload_vector.json

使用Thingsvision库创建图像嵌入,采用以下Thingsvision模型:

python model_name = clip model_parameters = { variant: ViT-B/32 }

代码目录包含用于地理标记图像以及生成向量的Python代码。该代码还可用于将嵌入上传到Qdrant DB实例。此代码不适用于生产环境,更侧重于快速且正确地获取坐标并嵌入图像。

此数据和代码的许可证与原始Google Landmarks V2数据集的许可证一致:CC BY 4.0许可证。

直接用途

主要用途是结合地理过滤的图像相似性搜索。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作