EVGeoQA
收藏arXiv2026-04-08 更新2026-04-10 收录
下载链接:
https://github.com/Hapluckyy/EVGeoQA/
下载链接
链接失效反馈官方服务:
资源简介:
EVGeoQA是由北京师范大学与国防科技大学联合构建的动态多目标地理空间探索基准数据集,聚焦电动汽车充电场景下的实时空间规划问题。该数据集覆盖杭州、青岛和临沂三座中国城市,包含48,518条问答对,数据来源于国家电网充电站记录和高德地图POI信息,并通过融合人口热力图与路网数据的K-Means聚类算法生成用户坐标。数据集通过模板生成与LLM改写相结合的方式构建,严格验证充电站与周边兴趣点的语义匹配度。该数据集旨在评估大语言模型在动态地理空间环境中的多目标协同规划能力,推动空间智能在导航服务、城市计算等领域的发展。
提供机构:
北京师范大学·人工智能学院; 北京师范大学·教育应用人工智能北京市重点实验室; 北京师范大学·教育部智能技术与教育应用工程研究中心; 国防科技大学·计算机科学与技术学院
创建时间:
2026-04-08
搜集汇总
数据集介绍

构建方式
在动态地理空间智能研究领域,构建能够反映真实世界复杂性的基准数据集至关重要。EVGeoQA数据集的构建始于对三个具有代表性的中国城市——杭州、青岛和临沂——的地理数据采集,整合了国家电网的充电站记录和高德地图API提供的兴趣点信息。为了生成符合真实查询分布的用户起始坐标,研究团队摒弃了传统的随机采样方法,创新性地提出了一种基于K-Means聚成的多源融合策略。该方法综合利用百度热力图所反映的人口流动密度与道路网络轮廓信息,通过加权采样模拟出统计意义上更贴近真实人类活动模式的空间锚点。在此基础上,通过模板化流程生成包含充电需求与协同活动偏好的双重目标初始查询,并进一步借助大型语言模型进行语义丰富的意译,将静态的兴趣点类别映射为生动的用户意图表达,最终通过严格的语义匹配与距离排序生成高质量的问题-答案对。
使用方法
EVGeoQA数据集旨在系统评估大型语言模型在复杂地理空间环境中的探索与推理能力。典型的使用方法依托于其配套的GeoRover评估框架,该框架采用工具增强的智能体架构。评估时,智能体被赋予一个包含动态用户坐标和双重目标的查询,例如“我想去充电并顺便喝杯咖啡”。智能体需要自主调用一套专门设计的原子化地理空间工具进行迭代探索,这些工具包括在局部半径内搜索充电站的SearchStations、检查周边兴趣点上下文的SearchPOIs、用于主动转移探索位置的ChangeLocation以及计算精确行车距离的CalculateDistance。智能体必须通过多步交互,综合历史探索轨迹,逐步扩大感知范围,直至找到一个能同时满足充电与活动偏好的目标充电站。该使用方法不仅测试模型的基础工具调用与信息提取能力,更着重考察其在部分可观测环境下的长期规划、主动探索和信息综合决策的高级空间智能。
背景与挑战
背景概述
随着大语言模型在复杂推理任务中展现出卓越潜力,其在动态地理空间环境中进行目标驱动探索的能力仍待深入挖掘。EVGeoQA数据集由北京师范大学与国防科技大学的研究团队于2026年共同创建,旨在填补现有地理空间问答基准在动态多目标规划评估方面的空白。该数据集以电动汽车充电场景为核心,创新性地将用户实时坐标与充电需求、协同活动偏好双重目标相结合,模拟真实世界中的复合空间决策问题。其覆盖杭州、青岛、临沂等不同规模城市,通过融合人口密度与路网数据的合成策略生成用户位置,显著提升了地理空间查询的真实性与代表性,为评估大语言模型在开放环境中的空间推理与规划能力提供了重要基准。
当前挑战
EVGeoQA所应对的核心领域挑战在于推动地理空间智能从静态检索向动态多目标探索的范式转变。传统地理空间问答基准多局限于基于离线数据库的事实查询,无法刻画用户位置动态变化与复合约束下的实时规划复杂性。在数据集构建过程中,研究团队面临多重挑战:其一,需设计能够同时满足充电需求与周边兴趣点功能匹配的双目标查询生成机制;其二,必须开发基于多源数据融合的用户坐标合成方法,以克服随机采样导致的空间偏差,确保查询分布符合真实世界模式;其三,需建立能够系统评估大语言模型在长距离、多步骤空间探索中表现的评价框架,这要求工具设计能支持迭代式环境交互与历史轨迹合成。
常用场景
经典使用场景
在动态地理空间智能研究领域,EVGeoQA数据集被广泛用于评估大语言模型在复杂、多目标空间探索任务中的推理与规划能力。该数据集模拟了电动汽车用户在充电过程中兼顾次级活动需求(如购物、餐饮)的真实场景,要求模型根据用户的实时坐标,在动态环境中寻找同时满足充电需求与邻近兴趣点约束的最优目标。这一设计将传统的地理空间问答从静态检索提升至动态规划层面,为检验模型在开放世界中的主动探索与多步决策能力提供了标准化的测试平台。
解决学术问题
EVGeoQA数据集主要解决了地理空间人工智能领域中长期存在的几个关键学术问题。它突破了传统地理空间问答基准局限于静态拓扑检索的框架,首次系统性地引入了动态用户坐标与双目标约束,从而能够评估模型在真实世界移动性场景下的复合需求处理能力。该数据集有效揭示了当前大语言模型在长距离空间探索中普遍存在的‘惰性’现象与性能衰减问题,同时发现了模型通过总结历史探索轨迹以提升效率的涌现能力。这些发现为理解与提升模型的空间推理、长期规划及信息合成能力指明了方向,推动了面向开放环境的具身空间智能研究。
实际应用
EVGeoQA数据集的设计理念直接源于智慧城市与出行服务的实际需求。其核心场景——电动汽车充电与活动协同规划——是城市计算与智能交通系统中的典型应用。该数据集可用于开发和评估车载导航助手、城市服务推荐系统等,这些系统需要理解用户的实时位置与复合意图(如“充电同时喝咖啡”),并在庞大的地理信息网络中做出高效、个性化的决策。此外,其评估框架GeoRover所采用的工具增强智能体架构,为构建能够主动调用地图API、进行迭代探索的实用型空间智能代理提供了技术范本,具有直接的产业转化潜力。
数据集最近研究
最新研究方向
在动态地理空间探索领域,EVGeoQA数据集的推出标志着地理空间问答研究从静态检索向多目标、实时约束的复杂规划任务演进。该数据集以电动汽车充电场景为依托,通过锚定用户实时坐标并融合充电需求与协同活动偏好的双重目标,构建了一个高度仿真的动态探索测试平台。近期研究聚焦于评估大语言模型在长距离空间探索中的能力瓶颈,特别是工具增强代理架构下的主动探索与轨迹总结能力。实验揭示,尽管模型在短距离场景中表现尚可,但在长范围探索中普遍存在“惰性”现象,即过早终止搜索并依赖有限信息生成答案。然而,研究也发现了模型通过总结历史探索轨迹以提升效率的涌现能力,这为开发更具战略意识的地理空间智能体提供了关键洞见。EVGeoQA不仅推动了地理空间推理与具身人工智能的交叉研究,也为智慧城市、自动驾驶等实际应用中的复杂决策任务设立了新的评估基准。
相关研究论文
- 1EVGeoQA: Benchmarking LLMs on Dynamic, Multi-Objective Geo-Spatial Exploration北京师范大学·人工智能学院; 北京师范大学·教育应用人工智能北京市重点实验室; 北京师范大学·教育部智能技术与教育应用工程研究中心; 国防科技大学·计算机科学与技术学院 · 2026年
以上内容由遇见数据集搜集并总结生成



