five

GeoLife GPS Trajectories|GPS轨迹数据集|位置数据分析数据集

收藏
微软开源数据集2023-04-05 更新2024-05-21 收录
GPS轨迹
位置数据分析
下载链接:
https://www.microsoft.com/en-us/download/details.aspx?id=52367
下载链接
链接失效反馈
资源简介:
This is a GPS trajectory dataset collected in (Microsoft Research Asia) <a href="https://www.microsoft.com/en-us/research/project/geolife-building-social-networks-using-human-location-history/">GeoLife</a> project by 182 users in a period of over three years (from April 2007 to August 2012). A GPS trajectory of this dataset is represented by a sequence of time-stamped points, each of which contains the information of latitude, longitude and altitude. This dataset contains 17,621 trajectories with a total distance of about 1.2 million kilometers and a total duration of 48,000+ hours. These trajectories were recorded by different GPS loggers and GPS-phones, and have a variety of sampling rates. 91 percent of the trajectories are logged in a dense representation, e.g. every 1~5 seconds or every 5~10 meters per point. This dataset recoded a broad range of users' outdoor movements, including not only life routines like go home and go to work but also some entertainments and sports activities, such as shopping, sightseeing, dining, hiking, and cycling. This trajectory dataset can be used in many research fields, such as mobility pattern mining, user activity recognition, location-based social networks, location privacy, and location recommendation.
提供机构:
Microsoft
AI搜集汇总
数据集介绍
main_image_url
构建方式
GeoLife GPS Trajectories数据集源自微软亚洲研究院的GeoLife项目,通过收集和整理来自182名用户在2007年至2012年间使用GPS设备记录的轨迹数据构建而成。这些数据涵盖了多种日常活动,包括工作、购物、旅游等,记录了用户在不同时间和地点的移动轨迹。数据集通过GPS设备每几秒至几分钟记录一次位置信息,包括经纬度、海拔高度和时间戳,确保了数据的精确性和连续性。
特点
该数据集的显著特点在于其高精度和多样性。首先,数据集包含了超过17,000条轨迹,总距离超过1,200,000公里,提供了丰富的地理和行为模式信息。其次,数据集不仅记录了位置信息,还标注了用户的活动类型,如步行、驾驶、公共交通等,这为研究人类移动模式和行为分析提供了宝贵的资源。此外,数据集的跨度时间长,覆盖了多种天气和交通条件,增强了数据的环境适应性和应用广泛性。
使用方法
GeoLife GPS Trajectories数据集适用于多种研究领域,包括但不限于交通规划、城市计算、移动行为分析和位置服务优化。研究者可以通过分析轨迹数据来识别和预测用户的移动模式,优化交通路线,或开发更智能的位置服务应用。使用该数据集时,研究者应首先进行数据清洗和预处理,以去除噪声和异常值,然后可以采用聚类、分类或预测模型等方法进行深入分析。数据集的开放性和详细标注为研究者提供了极大的灵活性和创新空间。
背景与挑战
背景概述
GeoLife GPS Trajectories数据集由微软亚洲研究院于2007年创建,主要研究人员包括Yuanquan Wang等人。该数据集收集了来自182名用户在2007年至2012年间在北京地区的GPS轨迹数据,共计17,621条轨迹,涵盖了多种日常活动,如工作、购物和休闲。这一数据集在地理信息系统(GIS)和移动行为研究领域具有重要影响力,为研究人类移动模式、交通分析和位置服务提供了宝贵的实证数据。
当前挑战
GeoLife GPS Trajectories数据集在构建过程中面临多项挑战。首先,数据采集涉及隐私保护问题,需确保用户位置信息的匿名化和安全性。其次,GPS信号在城市环境中易受建筑物和自然障碍物的干扰,导致数据精度下降。此外,数据集的多样性和代表性也是一个挑战,如何确保不同用户和不同活动类型的轨迹数据能够全面反映人类移动行为的复杂性,是研究者需要解决的关键问题。
发展历史
创建时间与更新
GeoLife GPS Trajectories数据集由微软研究院于2007年首次发布,旨在为地理信息系统和移动行为研究提供高质量的GPS轨迹数据。该数据集在2012年进行了重要更新,增加了更多的轨迹数据和用户行为分析。
重要里程碑
GeoLife GPS Trajectories数据集的发布标志着移动行为研究领域的一个重要里程碑。2007年,微软研究院首次公开了这一数据集,包含了来自182名用户的超过17,000条GPS轨迹,覆盖了多种日常活动和交通方式。2012年的更新进一步扩展了数据集的规模和多样性,为研究者提供了更丰富的数据资源,推动了基于位置的服务、交通模式分析和用户行为建模等领域的研究进展。
当前发展情况
当前,GeoLife GPS Trajectories数据集已成为地理信息系统和移动行为研究领域的基准数据集之一。它不仅为学术研究提供了宝贵的数据支持,还在实际应用中展现了其价值,如智能交通系统、城市规划和个性化服务设计。随着技术的进步和研究需求的增加,该数据集的影响力持续扩大,吸引了全球范围内的研究者和开发者进行深入探索和创新应用。
发展历程
  • GeoLife GPS Trajectories数据集首次由微软亚洲研究院发布,旨在研究人类移动模式和行为分析。
    2009年
  • 数据集被广泛应用于多个研究领域,包括交通规划、位置服务和移动性分析,显著推动了相关领域的研究进展。
    2011年
  • 随着数据集的持续更新和扩展,GeoLife GPS Trajectories开始被用于机器学习和数据挖掘算法的验证和测试。
    2013年
  • 数据集的公开性和高质量数据吸引了全球研究者的关注,成为移动数据分析领域的标准数据集之一。
    2015年
  • GeoLife GPS Trajectories数据集在多个国际会议和期刊上被引用,进一步巩固了其在学术界的影响力。
    2017年
  • 数据集的最新版本增加了更多用户和更长时间的轨迹数据,为研究者提供了更丰富的分析资源。
    2019年
常用场景
经典使用场景
GeoLife GPS Trajectories数据集在地理信息系统和移动行为研究领域中具有广泛的应用。该数据集记录了用户在特定时间段内的GPS轨迹,涵盖了步行、骑行、驾驶等多种交通方式。研究者常利用这些轨迹数据进行用户行为模式分析、交通流量预测以及位置推荐系统的设计。通过分析用户的移动轨迹,可以揭示城市交通的动态变化和用户的日常行为规律,为城市规划和智能交通系统提供重要参考。
解决学术问题
GeoLife GPS Trajectories数据集为解决多个学术研究问题提供了宝贵的数据支持。首先,它有助于深入理解人类移动模式,为研究个体和群体的行为特征提供了实证数据。其次,该数据集在交通网络优化、路径规划和拥堵预测等研究中发挥了关键作用,推动了智能交通系统的发展。此外,通过分析GPS轨迹,研究者还能探索位置隐私保护和数据安全等新兴领域的问题,为相关理论和技术的进步提供了实验基础。
衍生相关工作
GeoLife GPS Trajectories数据集的发布激发了大量相关研究工作。许多学者基于该数据集开展了关于人类移动模式预测的算法研究,提出了多种高效的预测模型。同时,该数据集也被用于验证和改进位置隐私保护技术,推动了隐私保护算法的发展。此外,基于GeoLife数据集的研究还扩展到了社交网络分析领域,通过分析用户的共同移动轨迹,揭示了社交网络的结构和动态变化,为社交网络分析提供了新的视角和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录