TrajPrism

Name: TrajPrism
Creator: 新南威尔士大学; 香港科技大学·广州
Published: 2026-05-12 00:17:13
License: 暂无描述

arXiv2026-05-12 更新2026-05-13 收录

下载链接：

https://anonymous.4open.science/r/TrajPrism-05D6/

下载链接

链接失效反馈

官方服务：

资源简介：

TrajPrism是由新南威尔士大学和香港科技大学广州团队构建的大规模多任务语言-轨迹对齐基准数据集，旨在推动城市轨迹理解研究。该数据集包含来自葡萄牙波尔图、美国旧金山和中国北京的30万条真实城市GPS轨迹，通过四维旅行意图分类法生成了210万个任务实例，涵盖指令条件轨迹生成、语义轨迹检索和轨迹描述三大任务。数据构建采用可复现的逆向意图重建流程，将地图匹配的轨迹压缩为语义阶段，并基于大语言模型合成多样化的语言标注，经过严格的质量控制与人工评判。该数据集主要应用于城市移动性分析、自然语言界面导航以及智能交通系统等领域，致力于解决真实轨迹与自然语言描述之间的细粒度对齐问题，为评估模型在轨迹保真度、检索质量和语言基础性方面的综合性能提供统一平台。

TrajPrism is a large-scale multi-task language-trajectory alignment benchmark dataset constructed by teams from the University of New South Wales and The Hong Kong University of Science and Technology (Guangzhou), aiming to advance urban trajectory understanding research. This dataset contains 300,000 real-world urban GPS trajectories collected from Porto, Portugal, San Francisco of the United States, and Beijing, China. It generates 2.1 million task instances via a four-dimensional travel intention taxonomy, covering three core tasks: instruction-conditioned trajectory generation, semantic trajectory retrieval, and trajectory description. The dataset is built using a reproducible reverse intention reconstruction pipeline: first compressing map-matched trajectories into semantic segments, then synthesizing diverse linguistic annotations with large language models (LLMs), followed by rigorous quality control and human evaluation. This dataset is primarily applied in fields such as urban mobility analysis, natural language interface navigation, intelligent transportation systems and other related domains. It is dedicated to addressing the fine-grained alignment problem between real-world trajectories and natural language descriptions, providing a unified platform for evaluating the comprehensive performance of models across trajectory fidelity, retrieval quality and linguistic grounding.

提供机构：

新南威尔士大学; 香港科技大学·广州

创建时间：

2026-05-12

原始信息汇总

根据提供的HTML内容，以下是对该数据集详情页面的总结：

数据集名称

TrajPrism

数据集概述

TrajPrism 是一个用于语义接地城市轨迹理解的多模态基准数据集，覆盖三个城市：波尔图、北京和旧金山。该基准旨在支持三个轨迹-语言任务。

任务与基线方法

任务	输入	输出	示例方法
任务1：轨迹生成	导航指令 + 起始位置	道路段轨迹	TrajAnchor（RAG增强）
任务2：轨迹检索	检索查询	匹配的轨迹	对比对齐
任务3：轨迹描述	轨迹	自然语言描述	TrajRAP

数据集文件结构（每个城市）

data/{city}/roadmap.rel — 有向道路网络边
data/{city}/roadmap.geo — 道路段属性与坐标
data/{city}/road_segment_h3_mapping.json — 道路段ID到H3单元的映射
data/{city}/semantics/h3_text_descriptions_v1.json — H3语义描述
traj_prism_datasets/{city}/processed/task{1,2,3}_{train,val,test}.jsonl — 各任务划分数据
traj_prism_datasets/{city}/processed/trajectory_db_{train,val,test}.jsonl — 轨迹数据库

任务2：指令-轨迹检索

轨迹编码器：支持 TrajCL、T-JEPA、UniTraj、BLUE 等骨干网络。
语义编码器：支持文本描述（H3语义描述默认）和GNN编码器。
训练模式：单编码器模式或融合模式（轨迹编码器 + 语义编码器 + 拼接融合）。

默认模型

所有基线任务默认使用 Qwen3.5-4B 作为大语言模型后端。

搜集汇总

数据集介绍

构建方式

TrajPrism的构建基于真实城市轨迹数据，覆盖波尔图、旧金山和北京三个城市，包含30万条经地图匹配的GPS轨迹。每条轨迹通过基于H3六边形网格的运行长度编码压缩为语义阶段序列，并利用四维出行意图分类体系（目的地、途经点、路线偏好、时间约束）进行结构化意图采样。随后，借助大型语言模型为每条轨迹生成三类导航指令、三条检索查询和一条轨迹描述，共计七项任务实例。生成的数据经过五阶段确定性质量控制和级联LLM与人工验证的评判流程，最终形成210万个任务实例。

特点

该数据集的核心特点在于实现了语言与轨迹的双向对齐，统一支持指令条件轨迹生成、语义轨迹检索和轨迹描述三项互补任务，并配套了涵盖轨迹保真度、检索质量和语言接地性的多维评估协议。基于真实观测轨迹而非合成数据，确保了生态效度；通过四维意图采样生成的多样化注释覆盖了从精确地标到模糊语义、从严格途经点到时间约束的广泛出行场景。跨城市、跨指令风格的构建方式揭示了任务难度在不同地理和语言条件下的显著变化。

使用方法

TrajPrism为每项任务提供了明确的输入输出规范和评估指标。在轨迹生成任务中，模型需根据自然语言导航指令和起始路段预测完整轨迹序列，以目标命中率、动态时间规整和杰卡德相似度等指标衡量。检索任务要求模型从候选池中识别与文本查询匹配的轨迹，评估召回率和平均倒数排名。描述任务则要求模型生成关于轨迹的事实性文本，通过BERTScore、ROUGE-L和POI召回率评估语言质量与空间接地性。研究者可直接使用公开发布的数据集和可复现的注释流水线，在兼容的轨迹输入和地图资源下扩展至新城市。

背景与挑战

背景概述

城市轨迹数据作为人类行为的重要载体，长期在几何空间中建模，缺乏与自然语言意图的深度对齐。TrajPrism数据集由新南威尔士大学与香港科技大学（广州）的研究团队于2025年共同创建，旨在弥合轨迹几何建模与语言理解之间的鸿沟。该数据集基于波尔图、旧金山和北京三大城市的真实GPS轨迹，通过逆向意图重构（RIR）框架为每条轨迹赋予自然语言描述，涵盖指令条件生成、语义检索与轨迹描述三项任务，共包含30万条轨迹与210万任务实例。其核心研究问题在于评估模型在统一框架下对轨迹保真度、检索质量与语言接地性的联合理解能力，为城市移动智能与人机交互提供了全新的基准范式。

当前挑战

TrajPrism所面临的挑战体现在三个层面。首先，在领域问题层面，现有轨迹建模高度依赖几何特征，而自然语言表达的城市移动意图（如时间偏好、路径约束）难以与纯坐标序列精确对齐，导致语言与轨迹之间的双向理解存在显著鸿沟。其次，在数据集构建过程中，研究团队需克服多重困难：从GPS轨迹中提取语义阶段并进行分层抽象，设计四维意图分类体系以覆盖多样化的出行意图，并通过级联式LLM判据与人工验证结合的质量控制流程，将幻觉率控制在可接受范围内。此外，不同城市的路网复杂度各异，北京的长距离轨迹与旧金山的短途行程在语言接地性上呈现截然不同的分布特征，进一步增加了评估的难度。

常用场景

经典使用场景

TrajPrism作为城市轨迹理解领域的多任务基准，其最经典的使用场景在于统一评估语言与轨迹之间的双向对齐能力。该数据集将真实城市GPS轨迹与结构化自然语言注释配对，支持三种互补任务：基于导航指令的轨迹生成、语言驱动的语义轨迹检索以及轨迹描述生成。研究者可利用该基准在波尔图、旧金山和北京三个城市共计30万条轨迹上，通过2.1百万个任务实例系统性地测试模型对空间语义的理解水平。这一设计使得TrajPrism成为首个在同一框架内联合评估轨迹保真度、检索质量与语言基础性的标准平台，为城市移动性研究提供了前所未有的精细化评测工具。

实际应用

在实际应用中，TrajPrism为城市智能交通系统和基于位置的服务提供了关键支撑。具体而言，该数据集可用于开发具备自然语言交互能力的导航系统，使驾驶员或乘客能够通过口语化指令获取精准路线；支持物流调度平台通过语义查询快速检索历史轨迹模式；赋能智能城市应用中的轨迹语义搜索功能，例如识别“避开主干道且经过公园区域的晨间通勤路线”。这些应用场景通过TrajPrism的语言-轨迹对齐框架得以实现，有效提升了移动出行服务的人机交互自然度和决策智能化水平，在智慧城市建设和个性化出行服务领域具有广泛部署潜力。

衍生相关工作

TrajPrism催生了一系列具有代表性的后续研究工作。作为任务的概念验证，研究团队开发了TrajAnchor用于指令条件轨迹生成，该管道通过检索相似轨迹作为空间锚点，结合链式Dijkstra寻路算法和LLM约束提取；TrajFuse作为语义轨迹检索的双编码器框架，通过对比学习融合几何与语义表示；TrajRap则采用检索增强的少样本提示策略生成事实性轨迹描述。这些模型不仅实例化了基准任务，还通过实验证明纯几何基线在语言接口上存在巨大性能差距。未来可预见的方向包括基于该基准的城市级轨迹基础模型预训练、跨城市迁移学习，以及多模态轨迹理解中的零样本泛化研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集