开放GPS轨迹数据集和旅行模式检测基准
收藏arXiv2021-09-28 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2109.08527v2
下载链接
链接失效反馈官方服务:
资源简介:
本数据集名为‘开放GPS轨迹数据集和旅行模式检测基准’,由东京大学空间信息科学中心创建。数据集包含475条轨迹数据,涵盖步行、自行车、公交和铁路四种旅行模式,收集自2020年10月,通过Android智能手机进行GPS记录。数据集旨在为旅行模式检测提供训练数据,解决现有模型训练数据不足的问题。创建过程中,数据集通过分析不同旅行模式的速度和其他特征来区分不同模式。应用领域包括城市交通规划和旅行行为分析。
This dataset, named *Open GPS Trajectory Dataset and Travel Mode Detection Benchmark*, was created by the Center for Spatial Information Science at The University of Tokyo. It includes 475 trajectory records covering four travel modes: walking, cycling, bus, and railway. The data was collected in October 2020 via GPS logging on Android smartphones. This dataset aims to provide training data for travel mode detection, addressing the shortage of training data for existing models. During its development, distinct travel modes were differentiated by analyzing their speed and other characteristic features. Its application domains include urban transportation planning and travel behavior analysis.
提供机构:
东京大学空间信息科学中心
创建时间:
2021-09-17
搜集汇总
数据集介绍

构建方式
在GPS轨迹与出行模式检测研究领域,构建高质量标注数据集是模型训练与性能评估的基础。本数据集通过七名独立志愿者在日本境内,利用智能手机采集了为期一个月的GPS轨迹数据,涵盖了步行、自行车、公交及铁路等多种出行模式。数据采集过程中,志愿者在开放区域以1秒为间隔记录位置信息,GPS精度在开阔地带可达10⁻⁷米(约地表2-3米),确保了数据的空间准确性。为确保数据的多样性与代表性,部分路线在不同时段被重复行走,以捕捉不同交通状况与道路条件的影响。所有行程的最短持续时间均设定为10分钟,最终共收集了212次步行、138次自行车、56次公交及69次铁路行程,形成了覆盖城市中心、郊区及城乡结合部等多种城市形态的轨迹集合。
特点
该数据集的核心特点在于其开放性与标注的完整性,为出行模式检测研究提供了首个公开的、带有精确出行模式标签的GPS轨迹基准数据。数据空间分布广泛,不仅涵盖了东京大都市区的高密度商业区与交通繁忙地带,也包括了柏市等普通城市的郊区与工业区域,有效反映了真实世界中的出行多样性。轨迹数据在时间维度上跨度完整,能够捕捉不同时段(如高峰与平峰)的出行特征。此外,数据集通过重复行走部分路线,增强了对于变化交通条件的表征能力,为模型训练提供了丰富的上下文信息。数据预处理环节还包含了异常位置误差的剔除(误差阈值设定为93.1米),并提供了以1至5分钟为间隔的降采样轨迹版本,便于研究不同时间粒度对检测性能的影响。
使用方法
该数据集可直接用于训练与评估出行模式检测模型,尤其适用于区分非机动化出行中的步行与自行车模式。在使用前,建议先对原始GPS轨迹进行预处理,包括基于记录误差的异常点过滤,以及根据研究需求进行时间间隔的降采样。研究可借鉴论文中采用的随机森林方法,构建包括总行程距离、时间跨度、平均速度、速度变化率、最大加速度等在内的多维特征集合。数据集可按80%与20%的比例随机划分为训练集与测试集,以进行模型训练与性能验证;为进一步确保模型稳健性,可采用十折交叉验证方法。处理后的特征数据可输入分类算法,实现对出行模式的自动判别,并为不同检测模型提供统一的性能比较基准。
背景与挑战
背景概述
在GPS轨迹数据处理领域,旅行模式检测一直是研究热点。由东京大学空间信息科学中心与南方科技大学联合研究团队于2020年创建的开放GPS轨迹数据集与旅行模式检测基准,旨在填补该领域公开标注数据的空白。该数据集由七名志愿者在日本历时一个月采集,涵盖步行、自行车、公交及铁路等多种出行模式,并覆盖城市中心至郊区的多样化交通环境。其核心研究问题在于为旅行模式检测算法提供标准化训练与评估基准,从而推动模型性能的客观比较与方法创新,对智能交通、城市规划及行为分析等领域具有重要参考价值。
当前挑战
该数据集致力于解决旅行模式检测中因数据稀缺与异构性导致的模型泛化能力不足的挑战。具体而言,在构建过程中面临多重困难:一是GPS信号在复杂城市环境中的多路径效应与遮挡问题,导致轨迹数据存在噪声与定位误差,需通过严格的质量控制与滤波处理;二是不同出行模式在低速或长采样间隔下速度特征高度重叠,如步行与自行车在低采样率轨迹中难以区分,需设计鲁棒的特征工程以捕捉细微差异;三是数据采集需平衡时空覆盖的全面性与标注一致性,涉及志愿者行为差异与设备异构性带来的标注偏差,增加了数据标准化难度。
常用场景
经典使用场景
在交通行为分析领域,开放GPS轨迹数据集和旅行模式检测基准为研究者提供了标准化的数据资源,用于训练和验证旅行模式检测模型。该数据集通过采集日本东京及周边地区多种交通方式(如步行、自行车、公交和铁路)的GPS轨迹,并结合时间与空间特征,构建了覆盖城市与乡村边缘的多样化场景。经典使用场景包括利用随机森林等机器学习方法,基于速度、距离和加速度等特征,从大规模GPS轨迹中自动识别出行模式,从而支持交通规划与行为研究。
衍生相关工作
基于该数据集衍生的经典工作包括扩展的旅行模式检测方法研究,如结合深度学习模型(如卷积神经网络或长短期记忆网络)提升识别精度。相关研究还聚焦于多模态轨迹融合,例如整合传感器数据(如加速度计)以增强特征表达。此外,数据集激发了跨领域应用,如出行行为预测、城市动态模拟以及交通网络优化,进一步推动了轨迹挖掘与时空数据分析的前沿进展。
数据集最近研究
最新研究方向
在智能交通与城市计算领域,开放GPS轨迹数据集和旅行模式检测基准的推出,为旅行模式识别研究提供了标准化评估框架。当前前沿研究聚焦于融合多源传感器数据与深度学习模型,以提升复杂城市环境下步行、骑行、公交及铁路等多种出行模式的分类精度。热点方向包括利用时空注意力机制解析轨迹序列的隐式特征,以及结合城市语义信息(如POI分布、路网拓扑)增强模型的可解释性。该数据集的开放促进了算法公平比较,推动了低碳出行分析与智慧城市调度系统的优化,对可持续交通规划具有重要实践意义。
相关研究论文
- 1An open GPS trajectory dataset and benchmark for travel mode detection东京大学空间信息科学中心 · 2021年
以上内容由遇见数据集搜集并总结生成



