Gowalla, Brightkite, Foursquare NYC, Foursquare Global, Hurricanes, Animals, Geolife, GoTrack, Vehicles, Promoters, SJGS
收藏github2024-05-16 更新2024-05-31 收录
下载链接:
https://github.com/bigdata-ufsc/datasets_v1_0
下载链接
链接失效反馈官方服务:
资源简介:
该仓库包含多种类型的轨迹数据集,如多方面轨迹、语义轨迹和整体轨迹,以及原始轨迹和语义轨迹。数据集包括Gowalla、Brightkite等社交网络数据,以及动物、车辆等不同类型的轨迹数据。
This repository encompasses a variety of trajectory datasets, including multi-faceted trajectories, semantic trajectories, and holistic trajectories, as well as raw trajectories and semantic trajectories. The datasets comprise social network data from platforms such as Gowalla and Brightkite, along with trajectory data from diverse sources like animals and vehicles.
创建时间:
2021-10-08
原始信息汇总
搜集汇总
数据集介绍

构建方式
该数据集的构建基于多种轨迹数据类型,涵盖了多方面的轨迹信息。具体而言,数据集包括了多个轨迹数据集,如Gowalla、Brightkite、Foursquare NYC和Foursquare Global等,这些数据集通过5折交叉验证的方式进行分割,以确保数据的多样性和代表性。此外,Hurricanes数据集进一步细分为不同的子集,以研究特定条件下的轨迹变化。原始轨迹数据如Animals、Geolife、GoTrack和Vehicles等,则提供了未经处理的轨迹信息,确保了数据的原始性和真实性。
特点
该数据集的显著特点在于其多样性和细分性。首先,数据集涵盖了从多方面轨迹到原始轨迹的广泛类型,满足了不同研究需求。其次,Hurricanes数据集的细分设计,使得研究者能够针对特定条件进行深入分析。此外,数据集的5折交叉验证分割方式,确保了数据在训练和测试阶段的平衡性,提升了模型的泛化能力。
使用方法
使用该数据集时,研究者可以根据研究需求选择合适的轨迹数据类型,如多方面轨迹、原始轨迹或语义轨迹。数据集提供了CSV和ZIP格式,便于直接导入和处理。对于需要特定条件分析的研究,Hurricanes数据集的细分子集提供了便捷的选择。此外,数据集的5折交叉验证格式,使得研究者可以轻松进行模型训练和测试,确保实验结果的可靠性。
背景与挑战
背景概述
本数据集由多个轨迹数据组成,涵盖了从地理位置到生物轨迹的广泛领域。这些数据集由Tarlis Tortelli Portela、Carlos Andres Ferrero等研究人员创建,主要用于支持高维轨迹分析的研究。数据集包括Gowalla、Brightkite、Foursquare NYC等社交网络位置数据,Hurricanes的气象数据,以及Animals、Geolife等生物和人类活动轨迹数据。这些数据集的创建旨在推动轨迹数据分析技术的发展,特别是在多维轨迹、语义轨迹和整体轨迹分析方面。通过提供这些数据集,研究人员能够进行更深入的实验和模型验证,从而在轨迹数据分析领域取得突破性进展。
当前挑战
这些数据集在构建和应用过程中面临多项挑战。首先,数据集的多样性要求研究人员开发能够处理不同类型轨迹数据的通用算法。其次,轨迹数据的复杂性和高维度使得数据预处理和特征提取成为一大难题。此外,如何有效地从这些轨迹数据中提取有意义的模式和信息,以支持实际应用,如气象预测、生物行为分析等,也是当前研究的重点和难点。最后,数据集的规模和分布特性对计算资源和算法效率提出了更高的要求,需要在保证精度的同时,提高处理速度和资源利用率。
常用场景
经典使用场景
在地理信息系统与轨迹分析领域,Gowalla、Brightkite、Foursquare NYC和Foursquare Global等数据集被广泛用于研究用户移动模式与位置社交网络的交互。这些数据集通过记录用户签到的时间、地点和活动,为研究者提供了丰富的时空数据,用于分析用户行为模式、社交网络的动态变化以及位置推荐系统的优化。
解决学术问题
这些数据集在解决用户移动模式预测、位置推荐系统优化以及社交网络动态分析等学术问题中发挥了重要作用。通过分析用户的签到数据,研究者能够揭示用户的行为规律,进而提升推荐系统的准确性。此外,这些数据集还为研究社交网络的演化提供了宝贵的实证数据,推动了相关领域的理论发展。
衍生相关工作
基于这些数据集,研究者们开展了多项经典工作,如HIPERMovelets、SUPERMovelets和MASTERMovelets等项目,专注于轨迹数据的分析与挖掘。这些项目通过引入新的算法和模型,进一步提升了轨迹数据的分析效率和准确性。此外,这些数据集还激发了大量关于用户行为模式和社交网络动态的研究,推动了相关领域的技术进步。
以上内容由遇见数据集搜集并总结生成



