five

Garden City

收藏
arXiv2024-12-02 更新2024-12-06 收录
下载链接:
https://github.com/Watts-Lab/nomad/tree/main/data
下载链接
链接失效反馈
官方服务:
资源简介:
Garden City是一个用于分析GPS人类移动数据预处理算法的合成数据集,由Thomas H. Li和Francisco Barreras创建。该数据集通过模拟商业数据集的特征,如噪声、稀疏性和时间聚类,生成合成轨迹,以评估和校准处理算法。数据集内容包括生成的城市、代理及其移动日志,以及稀疏轨迹生成器。创建过程涉及生成城市布局、代理移动模型和轨迹采样。该数据集主要应用于评估和改进GPS数据处理算法的鲁棒性,解决商业数据集中高稀疏性和噪声带来的误差问题。

Garden City is a synthetic dataset developed for analyzing preprocessing algorithms of GPS-based human mobility data, created by Thomas H. Li and Francisco Barreras. It generates synthetic trajectories by mimicking the core characteristics of real-world commercial datasets, including noise, sparsity and temporal clustering, to evaluate and calibrate target processing algorithms. The dataset encompasses generated urban environments, mobile agents and their mobility logs, as well as a sparse trajectory generator. Its creation involves generating urban layouts, agent mobility models and trajectory sampling. This dataset is mainly utilized to evaluate and improve the robustness of GPS data processing algorithms, tackling the error issues induced by high sparsity and noise in real-world commercial datasets.
提供机构:
研究机构未提及
创建时间:
2024-12-02
搜集汇总
数据集介绍
main_image_url
构建方式
Garden City数据集通过一个基于代理的模型生成合成的人类移动轨迹,旨在作为测试处理算法的‘ground-truth’。该模型包括三个主要部分:一个由矩形建筑和直线街道连接而成的生成城市;一个具有探索和优先返回(EPR)移动模型的合成人口,描述了全天访问的位置;以及一个稀疏轨迹采样器,考虑了运动中的‘微观’随机性、智能手机GPS传感器的噪声以及由突发和长时间不活动特征的时间不规则性。
特点
Garden City数据集的特点在于其能够模拟商业GPS数据集中的关键特征,如噪声、稀疏性和时间聚类。这使得研究人员能够在受控环境中评估处理算法的准确性和鲁棒性。此外,数据集的合成性质允许对算法在不同参数设置下的表现进行详细分析,从而提供对算法性能的深入理解。
使用方法
研究人员可以使用Garden City数据集来测试和验证各种处理GPS人类移动数据的算法。通过生成具有不同噪声和稀疏性水平的合成轨迹,可以评估算法在不同条件下的表现。数据集还提供了详细的教程和示例代码,帮助用户理解和实现数据集的使用。此外,数据集的开放源代码和公开可用性进一步促进了其在学术和工业研究中的广泛应用。
背景与挑战
背景概述
Garden City数据集由Thomas H. Li和Francisco Barreras创建,旨在解决GPS人类移动数据预处理算法评估中的挑战。该数据集的核心研究问题是如何在缺乏‘真实数据’的情况下,评估和校准这些算法。通过构建一个合成轨迹模拟器和沙盒环境,Garden City能够复制商业数据集中可能导致算法错误的特征,并允许研究人员将算法输出与‘真实’合成轨迹和移动日记进行比较。该数据集的创建对于提升GPS数据处理算法的鲁棒性和准确性具有重要意义,尤其是在流行病建模、灾难管理、社会隔离与不平等研究、交通规划、医疗分析和人类行为分析等领域。
当前挑战
Garden City数据集面临的挑战主要集中在两个方面。首先,商业GPS数据集通常存在偏差、高稀疏性和噪声,这些因素可能引入轨迹预处理算法的错误,影响下游结果的有效性。其次,缺乏‘真实数据’使得评估和校准这些算法变得尤为困难。构建过程中,如何精确模拟商业数据集的特征,如噪声、稀疏性和时间聚类,以及如何生成能够作为‘真实数据’的合成轨迹,都是该数据集面临的具体挑战。此外,如何在保持数据集灵活性的同时,确保其能够真实反映现实世界的复杂性,也是一项重要任务。
常用场景
经典使用场景
Garden City数据集的经典使用场景主要集中在GPS人类移动数据预处理算法的分析与评估。通过模拟合成的人类移动轨迹,该数据集为研究人员提供了一个理想的沙盒环境,用于测试和验证各种轨迹处理算法,如停留点检测、家庭和工作地点归属、行程检测与分类以及接触估计等。这些算法在处理高稀疏度和噪声的商业数据集时,往往面临鲁棒性不足的问题,而Garden City通过生成具有真实特征的合成数据,使得研究人员能够在受控条件下评估算法的准确性和鲁棒性。
实际应用
在实际应用中,Garden City数据集为公共卫生、城市规划、交通管理和灾难响应等领域提供了重要的工具。例如,在流行病模型中,准确的人类移动数据是预测疾病传播和制定干预策略的关键。通过使用Garden City生成的合成数据,研究人员可以在不依赖真实数据的情况下,优化和验证其模型,从而在实际应用中提高预测的准确性和可靠性。此外,该数据集还可用于培训和测试新的数据处理算法,确保其在面对真实世界复杂数据时的有效性。
衍生相关工作
Garden City数据集的推出催生了一系列相关研究工作,特别是在人类移动模型和轨迹生成领域。例如,一些研究者利用该数据集开发了新的停留点检测算法,通过模拟不同程度的稀疏性和噪声,评估算法的性能。此外,还有研究探讨了如何将Garden City的合成数据应用于城市规划和交通管理,通过模拟不同城市布局和人口移动模式,优化交通流量和减少拥堵。这些衍生工作不仅扩展了Garden City的应用范围,也推动了相关领域的技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作