GeoSeek

Hugging Face2026-02-14 更新2026-02-15 收录

下载链接：

https://huggingface.co/datasets/ghost233lism/GeoSeek

下载链接

链接失效反馈

官方服务：

资源简介：

GeoSeek 是一个用于训练 GeoAgent 的新型地理定位数据集，包含三个主要部分：GeoSeek-CoT（10k）、GeoSeek-Loc（20k）和 GeoSeek-Val（3k）。GeoSeek-CoT 包含由地理专家和专业地理定位游戏玩家标注的高质量思维链数据，每条数据包括街景图像、GPS坐标、三级位置标签（国家、城市、精确位置）以及人类推理过程，并标准化为统一的思维链格式。GeoSeek-Loc 包含用于基于强化学习的微调图像，采用考虑人口、土地面积和公路里程的分层抽样策略以减少地理偏差。GeoSeek-Val 是一个验证基准，包含可定位性分数和场景类别（人造结构、自然景观等）用于评估。数据集使用 cc-by-sa-4.0 许可证，语言为英语，适用于地理定位和相关任务。

GeoSeek is a novel geolocation dataset for training GeoAgent, which comprises three core components: GeoSeek-CoT (10k), GeoSeek-Loc (20k), and GeoSeek-Val (3k). GeoSeek-CoT contains high-quality chain-of-thought data annotated by geographic experts and professional geolocation gamers. Each sample includes street view images, GPS coordinates, three-level location tags (country, city, precise location) alongside human reasoning processes, and is standardized into a unified chain-of-thought format. GeoSeek-Loc provides image data for reinforcement learning-based fine-tuning, adopting a stratified sampling strategy that factors in population, land area and highway mileage to mitigate geographic bias. GeoSeek-Val acts as a validation benchmark, which includes locatability scores and scene categories (e.g., man-made structures, natural landscapes) for evaluation. The dataset is licensed under CC-BY-SA-4.0, uses English as its language, and is applicable to geolocation and related tasks.

创建时间：

2026-02-13

原始信息汇总

GeoSeek 数据集概述

数据集基本信息

数据集名称: GeoSeek
托管地址: https://huggingface.co/datasets/ghost233lism/GeoSeek
许可证: cc-by-sa-4.0
主要语言: 英语 (en)
数据规模: 10K<n<100K
标签: Geo, geo_location

数据集配置与文件

数据集包含三个配置，每个配置对应一个数据文件：

配置名称: Cot
- 数据文件: GeoSeek_Cot.json
- 分割: GeoSeek_Cot
配置名称: Loc
- 数据文件: GeoSeek_Loc.json
- 分割: GeoSeek_Loc
配置名称: Val
- 数据文件: GeoSeek_Val.json
- 分割: GeoSeek_Val

数据集内容与构成

GeoSeek-CoT

数据量: 10k 条
描述: 由地理专家和专业地理定位游戏玩家标注的高质量思维链数据。
数据条目包含:
- 街景图像
- GPS坐标
- 三级位置标签（国家、城市、精确位置）
- 人类推理过程（已标准化为统一的思维链格式）

GeoSeek-Loc

数据量: 20k 条
描述: 用于基于强化学习的微调图像。
采样策略: 采用分层策略，综合考虑人口、土地面积和公路里程，以减少地理偏差。

GeoSeek-Val

数据量: 3k 条
描述: 用于评估的验证基准。
包含信息:
- 可定位性分数
- 场景类别（如人造结构、自然景观等）

关联资源

项目页面: https://ghost233lism.github.io/GeoAgent-page/
GitHub仓库: https://github.com/HVision-NKU/GeoAgent
模型: https://huggingface.co/ghost233lism/GeoAgent
演示: https://huggingface.co/spaces/ghost233lism/GeoAgent

搜集汇总

数据集介绍

构建方式

在空间信息科学领域，高质量地理定位数据的构建对于推动智能体理解复杂环境至关重要。GeoSeek数据集通过专家与专业玩家的协同标注，形成了包含一万条高质量思维链数据的GeoSeek-CoT子集，每条数据均整合了街景图像、GPS坐标、三级位置标签及标准化的人类推理过程。同时，采用基于人口、土地面积与公路里程的分层采样策略，构建了包含两万张图像的GeoSeek-Loc子集，以有效缓解地理分布偏差。此外，数据集还包含三千条样本的GeoSeek-Val验证基准，并标注了可定位性分数与场景类别，为模型评估提供了结构化基础。

特点

GeoSeek数据集在计算机视觉与地理信息交叉研究中展现出鲜明的多维特征。其核心优势在于融合了视觉数据与语义推理，GeoSeek-CoT子集通过统一的思维链格式，将人类专家的地理推理过程结构化，为模型提供了可解释的学习范例。数据集在采样设计上注重地理代表性，GeoSeek-Loc子集通过分层策略覆盖了多样化的地理与人文环境，增强了模型的泛化能力。验证集不仅包含常规定位标签，还引入了可定位性量化评分与场景分类，使得评估体系更为精细与全面，能够支撑从基础定位到复杂场景理解的多种研究需求。

使用方法

该数据集服务于地理定位智能体的训练与评估，其使用遵循清晰的方法论路径。研究者可首先利用GeoSeek-CoT子集进行监督学习或思维链推理训练，使模型掌握从图像特征到地理位置的多步推理逻辑。随后，GeoSeek-Loc子集适用于基于强化学习的微调阶段，其无偏的样本分布有助于提升模型在真实世界中的稳健性。最终，GeoSeek-Val子集作为独立的评估基准，用户可通过其提供的可定位性分数与场景类别标签，系统性地量化模型在不同地理场景下的性能表现，从而完成从训练、微调到评估的完整研究闭环。

背景与挑战

背景概述

GeoSeek数据集由南开大学视觉计算与图像处理实验室及西北工业大学自动化学院的研究团队于近期构建，旨在推动地理定位智能体的发展。该数据集的核心研究问题聚焦于如何让机器通过街景图像理解并推理出精确的地理位置，从而应对开放世界环境下的通用地理定位挑战。其设计融合了专家标注的思维链数据与基于强化学习的微调样本，通过引入多层次位置标签和人类推理过程，为地理人工智能领域提供了高质量、低偏差的基准数据，显著提升了模型在复杂真实场景中的地理空间认知与推理能力。

当前挑战

在解决地理定位这一领域问题时，GeoSeek数据集面临的核心挑战在于克服街景图像中存在的巨大视觉多样性以及地理位置先验分布的不均衡性。具体而言，模型需从有限视觉线索中辨识跨越不同国家、城市乃至具体地点的细微特征，同时避免因训练数据的地理偏差而导致对人口稀疏或偏远地区的定位性能下降。在构建过程中，研究团队通过分层采样策略综合考虑人口、土地面积和公路里程等因素以缓解数据偏差，并需将专家与游戏玩家的非结构化推理过程标准化为统一的思维链格式，这涉及复杂的数据清洗与标注质量控制。

常用场景

经典使用场景

在计算机视觉与地理信息科学的交叉领域，GeoSeek数据集为地理定位任务提供了关键支持。其经典使用场景在于训练和评估智能体进行多粒度地理位置识别，通过结合街景图像、GPS坐标及层级化位置标签，模型能够模拟人类推理过程，逐步从国家、城市到精确地点进行定位，从而提升地理感知的准确性与解释性。

衍生相关工作

围绕GeoSeek数据集，衍生出了一系列经典研究工作，尤其是其关联的GeoAgent项目。该项目利用强化学习与思维链机制，构建了能够自主探索地理特征的智能体，推动了地理定位模型从静态识别向动态推理的演进。后续研究在此基础上扩展了多模态融合、跨域迁移等方向，为地理人工智能领域注入了新的方法论活力。

数据集最近研究