Metropolitan Scale and Longitudinal Dataset of Anonymized Human Mobility Trajectories
收藏arXiv2023-07-07 更新2024-06-21 收录
下载链接:
https://zenodo.org/record/8111993
下载链接
链接失效反馈官方服务:
资源简介:
本数据集名为‘Metropolitan Scale and Longitudinal Dataset of Anonymized Human Mobility Trajectories’,由麻省理工学院和雅虎日本公司共同创建。数据集包含100,000个个体在90天内的移动轨迹,数据来源于移动电话位置数据,经过匿名处理以保护用户隐私。数据集的创建旨在解决由于缺乏开放源的大规模人类移动数据集而难以进行公平性能比较的问题。该数据集的应用领域包括人类行为分析、交通和活动分析、灾害风险管理、疫情建模和城市规划等。
This dataset, named *Metropolitan Scale and Longitudinal Dataset of Anonymized Human Mobility Trajectories*, was co-created by the Massachusetts Institute of Technology (MIT) and Yahoo Japan Corporation. It encompasses mobility trajectories of 100,000 individuals over a 90-day period, derived from mobile phone location data and anonymized to protect user privacy. This dataset was developed to address the challenge of conducting fair performance comparisons due to the scarcity of open-source large-scale human mobility datasets. Its application domains include human behavior analysis, transportation and activity analysis, disaster risk management, epidemic modeling, and urban planning, among others.
提供机构:
麻省理工学院数据、系统与社会研究所
创建时间:
2023-07-07
搜集汇总
数据集介绍

构建方式
在人类移动性研究领域,构建大规模、真实且开放的数据集对于推动模型发展至关重要。该数据集基于雅虎日本公司提供的智能手机GPS位置数据,通过严格的隐私保护流程构建而成。首先,从原始数据中选取位于日本某未公开大都市区的用户,确保每位用户在10天内至少被观测10次。随后,地理位置信息被离散化为500米×500米的网格单元,时间戳则按30分钟间隔进行分箱处理,同时隐藏实际日期以进一步保护隐私。数据集最终包含10万名用户在90天内的移动轨迹,其中75天为常规时期,15天为紧急状态时期,以捕捉不同情境下的行为模式。
特点
该数据集在人类移动性研究中展现出独特价值,其核心特点在于规模宏大且设计精细。数据集覆盖10万名匿名用户的移动轨迹,时间跨度长达90天,提供了前所未有的时空覆盖度。空间上,轨迹被映射到200×200的网格系统中,每个单元约500米见方,实现了对城市与乡村区域的混合表征。时间维度上,数据以30分钟为间隔进行离散化,清晰揭示了日间与夜间的活动规律。此外,数据集特意区分了常规时期与紧急状态时期,为研究异常行为模式提供了宝贵素材。数据分布呈现出典型的城市动态特征,如工作日与周末的规律性波动,以及不同区域访问频率的显著差异,这些特点共同支撑了其在预测建模中的广泛应用潜力。
使用方法
该数据集旨在促进人类移动性预测模型的公平比较与创新。研究人员可通过Zenodo平台申请访问数据,数据以压缩CSV格式提供,包含用户ID、掩码日期、时间槽及网格坐标等字段。数据集附带兴趣点信息,以85维向量形式描述每个网格单元的功能属性,可作为预测任务的辅助特征。典型应用场景包括参与HuMob挑战赛,其中任务一要求基于常规时期数据预测2万名用户未来15天的移动轨迹,任务二则聚焦紧急状态下的行为预测。评估采用动态时间规整与GEO-BLEU双重指标,兼顾轨迹整体相似性与局部特征匹配。使用中需严格遵守伦理规范,禁止任何试图重新识别用户或损害隐私的行为,确保数据在学术框架内发挥最大效用。
背景与挑战
背景概述
在人类移动性研究领域,理解、建模和预测城市环境中个体移动轨迹对于交通规划、流行病建模、灾害风险管理及城市设计等应用至关重要。传统上,这类研究依赖于旅行调查和人口普查数据,但近年来移动设备采集的大规模位置数据为复杂移动性模型的开发提供了新机遇。由麻省理工学院、东京大学和雅虎日本公司等机构的研究人员于2023年创建的“大都市尺度匿名人类移动轨迹纵向数据集”,旨在填补开源、大规模、真实世界个体移动数据集的空白。该数据集包含日本某未公开大都市区10万个体在90天内的移动轨迹,数据经过空间(500米网格)和时间(30分钟间隔)离散化处理以保护隐私,其中涵盖75天常规期和15天紧急情况期。该数据集的发布通过举办“HuMob Challenge 2023”竞赛,推动了人类移动预测方法的公平比较与创新,对城市计算和空间信息科学领域产生了显著影响。
当前挑战
该数据集致力于解决人类移动轨迹预测这一核心领域问题,其挑战在于移动模式的高度动态性和个体行为的异质性,例如日常通勤与紧急情况下移动规律的突变,以及城市与乡村区域移动特征的差异,这要求模型具备强大的时空建模与泛化能力。在构建过程中,研究团队面临多重挑战:首先,隐私保护与数据效用之间的平衡极为关键,需通过网格离散化、时间掩码和区域匿名化等技术手段,在防止用户重新识别的同时保留移动模式的统计特征;其次,数据采集与处理涉及大规模移动设备位置记录的筛选、清洗和标准化,需应对采样率不均、设备电池节能策略导致的观测频率变化,以及确保长期纵向数据的一致性与完整性。这些挑战共同塑造了数据集的科学价值与应用边界。
常用场景
经典使用场景
在人类移动性研究领域,大都会尺度与纵向匿名人类移动轨迹数据集为预测模型提供了标准化基准。该数据集通过整合10万个体在90天内的移动轨迹,并采用500米网格与30分钟时间槽的离散化处理,为研究者提供了高分辨率且隐私保护的时空数据。其经典应用场景体现在人类移动性预测挑战赛中,参与者利用该数据集开发算法,预测个体在常规与紧急情况下的移动模式,从而推动模型性能的公平比较与优化。
衍生相关工作
该数据集衍生了一系列经典研究工作,包括人类移动性预测算法的创新与评估指标的开发。例如,基于数据集的HuMob挑战赛催生了多种深度学习与时空模型,如循环神经网络与图卷积网络的融合应用。同时,研究者提出了GEO-BLEU等新型评估指标,专门用于衡量地理序列的相似性。这些工作不仅拓展了移动性预测的方法论,还为隐私保护下的数据利用设立了新范式。
数据集最近研究
最新研究方向
在智慧城市与计算社会科学领域,匿名化人类移动轨迹数据集正推动着时空预测模型的革新。该数据集通过整合大都会尺度、纵向追踪及紧急情境下的行为模式,为研究者提供了评估模型泛化能力与鲁棒性的基准平台。当前前沿研究聚焦于利用深度学习架构,如时空图神经网络与注意力机制,以捕捉个体移动中的复杂时空依赖关系。同时,数据集关联的‘HuMob Challenge 2023’竞赛事件,促进了跨学科团队在隐私保护框架下探索轨迹预测的精度边界,其成果对城市应急管理、传染病建模及可持续交通规划具有深远影响。
相关研究论文
- 1Metropolitan Scale and Longitudinal Dataset of Anonymized Human Mobility Trajectories麻省理工学院数据、系统与社会研究所 · 2023年
以上内容由遇见数据集搜集并总结生成



