GeoLife
收藏DataCite Commons2020-08-01 更新2024-07-13 收录
下载链接:
https://star.cs.ucr.edu/?GeoLife&d
下载链接
链接失效反馈官方服务:
资源简介:
This GPS trajectory dataset was collected in (Microsoft Research Asia) Geolife project by 178 users in a period of over four years (from April 2007 to October 2011). A GPS trajectory of this dataset is represented by a sequence of time-stamped points, each of which contains the information of latitude, longitude and altitude. This dataset contains 17,621 trajectories with a total distance of 1,251,654 kilometers and a total duration of 48,203 hours. These trajectories were recorded by different GPS loggers and GPS-phones, and have a variety of sampling rates. 91 percent of the trajectories are logged in a dense representation, e.g. every 1~5 seconds or every 5~10 meters per point. This dataset recoded a broad range of users??? outdoor movements, including not only life routines like go home and go to work but also some entertainments and sports activities, such as shopping, sightseeing, dining, hiking, and cycling. This trajectory dataset can be used in many research fields, such as mobility pattern mining, user activity recognition, location-based social networks, location privacy, and location recommendation.
本GPS轨迹数据集由微软亚洲研究院(Microsoft Research Asia)GeoLife项目采集,共有178名用户参与,采集周期跨越四年有余(2007年4月至2011年10月)。该数据集的每条GPS轨迹均由一系列带时间戳的点位构成,每个点位均包含纬度、经度与海拔信息。本数据集共计收录17621条轨迹,总行驶里程达1251654公里,总时长为48203小时。这些轨迹由不同型号的GPS记录仪与GPS手机采集,采样率存在差异。其中91%的轨迹采用高密度采样记录方式,例如每1~5秒或每5~10米采集一个点位。本数据集记录了覆盖广泛用户群体的户外出行活动,不仅涵盖通勤归家、日常上班等生活轨迹,还包含购物、观光、就餐、徒步与骑行等娱乐及体育活动。该轨迹数据集可应用于诸多研究领域,例如出行模式挖掘、用户行为识别、基于位置的社交网络、位置隐私保护与位置推荐等。
提供机构:
UCR-Star
创建时间:
2020-03-03
搜集汇总
数据集介绍

构建方式
GeoLife数据集由微软亚洲研究院构建,涵盖了来自182名用户的五年间(2007-2012)的GPS轨迹数据。这些数据通过智能手机收集,每条记录包含时间戳、经纬度、海拔高度以及活动类型(如步行、驾驶、公共交通等)。数据集的构建过程包括数据清洗、去噪、标准化处理,确保了数据的准确性和一致性。
特点
GeoLife数据集以其高精度和多样性著称,提供了丰富的时空信息,适用于多种地理信息系统(GIS)和位置服务(LBS)的研究。其特点包括多样的活动类型标签、高频率的采样间隔(通常为几秒到几分钟),以及涵盖多种城市和乡村环境的地理覆盖范围。这些特点使得GeoLife成为研究人类移动模式、交通流量分析和位置预测等领域的理想数据源。
使用方法
GeoLife数据集可用于多种研究目的,包括但不限于人类移动模式分析、交通流量预测、位置推荐系统开发等。研究者可以通过分析用户的轨迹数据,提取出行模式、停留点、路径选择等特征,进而构建模型预测未来的移动行为。此外,该数据集还可用于评估和优化基于位置的服务算法,如路径规划和位置隐私保护技术。使用时,研究者需注意数据隐私和伦理问题,确保合法合规地进行数据分析和应用。
背景与挑战
背景概述
GeoLife数据集由微软亚洲研究院于2007年发布,旨在为地理信息系统(GIS)和移动计算领域的研究提供丰富的时空数据。该数据集包含了来自182名用户在2007年至2012年间在北京地区的日常活动轨迹,涵盖了步行、骑行、驾车等多种交通方式。GeoLife的发布极大地推动了基于位置的服务(LBS)、用户行为分析以及城市规划等领域的研究,为学者们提供了一个宝贵的实验平台,促进了相关算法的开发与验证。
当前挑战
尽管GeoLife数据集在地理信息和移动计算领域具有重要意义,但其构建过程中也面临诸多挑战。首先,数据采集涉及隐私保护问题,如何在确保用户隐私的前提下收集和处理位置数据是一个复杂的问题。其次,数据集中的轨迹数据存在噪声和缺失,这要求研究者在分析时进行有效的数据清洗和预处理。此外,如何从海量的轨迹数据中提取有意义的行为模式和规律,也是该数据集应用中的一个重要挑战。
发展历史
创建时间与更新
GeoLife数据集由微软亚洲研究院于2007年创建,旨在研究人类移动模式。该数据集在2012年进行了重大更新,增加了更多的用户和详细的位置信息,使其成为地理信息系统和移动计算领域的重要资源。
重要里程碑
GeoLife数据集的一个重要里程碑是其在2012年的更新,这次更新不仅扩展了数据集的规模,还引入了更精细的时间戳和位置精度,极大地提升了数据集的研究价值。此外,GeoLife数据集在2015年被广泛应用于多个国际会议和期刊,成为评估和比较移动模式分析算法的标准数据集。这些里程碑事件标志着GeoLife在地理信息科学和移动计算领域的核心地位。
当前发展情况
当前,GeoLife数据集继续在地理信息系统和移动计算领域发挥重要作用。它被广泛用于研究人类移动模式、预测模型和位置隐私保护等前沿课题。随着技术的进步,GeoLife数据集也在不断更新和扩展,以适应新的研究需求。其对相关领域的贡献不仅体现在提供了丰富的实证数据,还推动了算法和模型的创新与发展,为未来的智能城市和移动服务提供了宝贵的理论和实践基础。
发展历程
- GeoLife数据集首次发表,由微软亚洲研究院发布,包含182名用户在2007年至2012年间的GPS轨迹数据。
- GeoLife数据集被广泛应用于多个研究领域,包括地理信息系统、移动计算和人类行为分析。
- GeoLife数据集的扩展版本发布,增加了更多的用户和详细的轨迹信息,进一步丰富了数据集的内容。
- GeoLife数据集成为移动计算和位置服务领域的基准数据集,被大量研究论文引用和使用。
- GeoLife数据集的应用范围扩展至智能交通系统和城市规划领域,展示了其在多学科交叉研究中的价值。
常用场景
经典使用场景
在地理信息科学领域,GeoLife数据集以其丰富的时空轨迹数据而著称。该数据集记录了用户在不同时间段内的地理位置信息,为研究人类移动模式提供了宝贵的资源。通过分析这些轨迹,研究者能够深入探讨个体和群体的移动行为,如日常通勤、旅游模式以及应急响应等。
实际应用
在实际应用中,GeoLife数据集被广泛用于城市规划、交通管理和应急响应等领域。通过分析用户的移动轨迹,城市规划者可以优化公共交通路线和设施布局,提升城市运行效率。交通管理者则可以利用这些数据来预测交通流量,制定有效的交通控制策略。在应急响应方面,GeoLife数据集能够帮助快速定位受影响区域,提高救援效率。
衍生相关工作
基于GeoLife数据集,许多经典工作得以展开。例如,研究者们开发了多种移动预测算法,显著提升了预测准确性。此外,该数据集还激发了对隐私保护和数据安全问题的深入研究,推动了相关技术的进步。在社会科学领域,GeoLife数据集也被用于研究人类行为和社会网络,产生了大量有影响力的学术成果。
以上内容由遇见数据集搜集并总结生成



