GeoComp
收藏arXiv2025-02-19 更新2025-02-27 收录
下载链接:
https://huggingface.co/datasets/ShirohAO/tuxun
下载链接
链接失效反馈官方服务:
资源简介:
GeoComp是一个大规模的地理定位数据集,由阿联酋马斯达尔理工学院发起,收集了两年内740K用户的游戏数据。该数据集包含2500万个元数据和300万个地理标记位置,覆盖全球大部分地区,每个位置由数千至数万次人类用户进行标注。数据集具有多样的难度水平,可详细分析,突出了当前模型中的关键差距。
GeoComp is a large-scale geolocation dataset initiated by the Masdar Institute of Science and Technology, United Arab Emirates. It collected gaming data from 740,000 users over a two-year period, containing 25 million metadata entries and 3 million geotagged locations covering most global regions. Each location has been annotated by thousands to tens of thousands of human users. The dataset features diverse difficulty levels, enabling in-depth analytical investigations and highlighting key gaps in current models.
提供机构:
阿联酋马斯达尔理工学院
创建时间:
2025-02-19
搜集汇总
数据集介绍

构建方式
GeoComp数据集的构建方式是通过一个在线地理猜谜游戏平台收集而来,该平台吸引了超过74万用户参与,并持续了两年时间。用户在平台上根据图像猜测地点,并标注了超过2500万个元数据和300万个带有地理标签的位置。每个位置都被人类用户数千次至数万次地进行标注,从而确保了数据的多样性和可靠性。此外,该数据集还包含了人类玩家的表现数据,这些数据不仅用于评估任务的难度,还可以作为理解人类在地理定位挑战中决策的基准。
特点
GeoComp数据集的特点在于其规模之大、多样性之广以及高质量的人为标注。数据集涵盖了全球大部分地区,并且每个位置都有大量的人类标注,这使得数据集能够提供不同难度级别的任务,有助于详细分析。此外,数据集还包含了人类玩家的表现数据,这为评估任务难度和理解人类决策提供了宝贵的信息。GeoComp数据集是首个包含真实、丰富的玩家表现数据的地理定位数据集,为地理定位研究提供了新的视角和挑战。
使用方法
使用GeoComp数据集的方法包括:1. 数据准备:首先,需要将数据集下载并解压,然后将其中的图像和元数据加载到程序中。2. 数据预处理:根据研究需求,可以对数据进行清洗、去重和格式化等预处理操作。3. 数据分析:使用统计分析、可视化等方法对数据进行探索性分析,以了解数据的分布特征和潜在规律。4. 模型训练:使用机器学习或深度学习模型对数据进行训练,以实现地理定位任务。5. 评估与优化:使用GeoEval评估指标对模型的性能进行评估,并根据评估结果进行模型优化和参数调整。6. 应用与推广:将训练好的模型应用于实际的地理定位任务中,并根据实际应用情况进行推广和改进。
背景与挑战
背景概述
地理定位任务在导航、监测和文化保护等领域具有至关重要的意义。然而,现有的地理定位方法往往只能提供粗糙、不准确且不可解释的定位结果。主要挑战在于现有地理定位数据集的质量和规模。这些数据集通常规模较小,且为自动构建,导致数据噪声大且任务难度不一致。为了解决这些挑战,我们引入了一个综合的地理定位框架,包括三个关键组成部分:GeoComp,一个大型数据集;GeoCoT,一种新颖的推理方法;以及GeoEval,一种评估指标,共同设计用于解决关键挑战并推动地理定位研究的进展。GeoComp的核心是一个从地理定位游戏平台收集的大型数据集,该平台涉及74万用户,历时两年。它包括2500万条元数据和300万个地理标记的位置,覆盖全球大部分地区,每个位置都由人类用户数千到数万次进行注释。该数据集提供了不同难度级别的详细分析,并突出了当前模型中的关键差距。
当前挑战
地理定位任务的关键挑战在于构建高质量和大规模的数据集。现有的地理定位数据集通常规模较小,且为自动构建,导致数据噪声大且任务难度不一致。此外,图像可能过于容易揭示答案,或者缺乏足够的线索以进行可靠的推理。为了解决这些挑战,我们引入了一个大型数据集GeoComp,该数据集由人类用户在地理定位游戏平台上收集,并提供了不同难度级别的详细分析。此外,我们还提出了GeoCoT,一种新颖的多步推理框架,旨在增强大型视觉模型(LVMs)在地理定位任务中的推理能力。GeoCoT通过多步过程整合上下文和空间线索,模拟人类的地理定位推理,从而提高性能。最后,通过GeoEval指标,我们展示了GeoCoT在提高地理定位准确性的同时增强了可解释性。
常用场景
经典使用场景
GeoComp数据集在图像地理定位任务中具有广泛的应用价值。该数据集通过模拟真实人类的游戏玩法数据,提供了大规模的地理定位标注,为研究者提供了丰富的训练和测试资源。其中,GeoCoT作为一种多步推理框架,通过分析图像中的地标、环境特征和空间关系等地理线索,实现了对地理定位任务的细粒度预测,从而在图像地理定位领域取得了显著的成果。
实际应用
GeoComp数据集及其相关研究成果在实际应用中具有重要的价值。例如,在导航、监控、文化保护等领域,GeoComp数据集可以用于训练和评估地理定位模型,提高定位的准确性和效率。此外,GeoCoT框架的多步推理过程可以用于生成解释性的推理链条,帮助人们更好地理解地理定位的过程和结果。
衍生相关工作
GeoComp数据集及其相关研究成果衍生了大量的相关工作。例如,基于GeoComp数据集,研究者们开发了多种地理定位模型,如GeoCLIP、GeoReasoner等,这些模型在地理定位任务中取得了显著的成果。此外,GeoCoT框架的多步推理过程也被应用于其他领域,如医学图像理解、文档解析等,为相关领域的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



