five

GeoLife|户外移动轨迹数据集|位置数据分析数据集

收藏
DataCite Commons2020-08-01 更新2024-07-13 收录
户外移动轨迹
位置数据分析
下载链接:
https://star.cs.ucr.edu/?GeoLife&d
下载链接
链接失效反馈
资源简介:
This GPS trajectory dataset was collected in (Microsoft Research Asia) Geolife project by 178 users in a period of over four years (from April 2007 to October 2011). A GPS trajectory of this dataset is represented by a sequence of time-stamped points, each of which contains the information of latitude, longitude and altitude. This dataset contains 17,621 trajectories with a total distance of 1,251,654 kilometers and a total duration of 48,203 hours. These trajectories were recorded by different GPS loggers and GPS-phones, and have a variety of sampling rates. 91 percent of the trajectories are logged in a dense representation, e.g. every 1~5 seconds or every 5~10 meters per point. This dataset recoded a broad range of users??? outdoor movements, including not only life routines like go home and go to work but also some entertainments and sports activities, such as shopping, sightseeing, dining, hiking, and cycling. This trajectory dataset can be used in many research fields, such as mobility pattern mining, user activity recognition, location-based social networks, location privacy, and location recommendation.
提供机构:
UCR-Star
创建时间:
2020-03-03
AI搜集汇总
数据集介绍
main_image_url
构建方式
GeoLife数据集由微软亚洲研究院构建,涵盖了来自182名用户的五年间(2007-2012)的GPS轨迹数据。这些数据通过智能手机收集,每条记录包含时间戳、经纬度、海拔高度以及活动类型(如步行、驾驶、公共交通等)。数据集的构建过程包括数据清洗、去噪、标准化处理,确保了数据的准确性和一致性。
特点
GeoLife数据集以其高精度和多样性著称,提供了丰富的时空信息,适用于多种地理信息系统(GIS)和位置服务(LBS)的研究。其特点包括多样的活动类型标签、高频率的采样间隔(通常为几秒到几分钟),以及涵盖多种城市和乡村环境的地理覆盖范围。这些特点使得GeoLife成为研究人类移动模式、交通流量分析和位置预测等领域的理想数据源。
使用方法
GeoLife数据集可用于多种研究目的,包括但不限于人类移动模式分析、交通流量预测、位置推荐系统开发等。研究者可以通过分析用户的轨迹数据,提取出行模式、停留点、路径选择等特征,进而构建模型预测未来的移动行为。此外,该数据集还可用于评估和优化基于位置的服务算法,如路径规划和位置隐私保护技术。使用时,研究者需注意数据隐私和伦理问题,确保合法合规地进行数据分析和应用。
背景与挑战
背景概述
GeoLife数据集由微软亚洲研究院于2007年发布,旨在为地理信息系统(GIS)和移动计算领域的研究提供丰富的时空数据。该数据集包含了来自182名用户在2007年至2012年间在北京地区的日常活动轨迹,涵盖了步行、骑行、驾车等多种交通方式。GeoLife的发布极大地推动了基于位置的服务(LBS)、用户行为分析以及城市规划等领域的研究,为学者们提供了一个宝贵的实验平台,促进了相关算法的开发与验证。
当前挑战
尽管GeoLife数据集在地理信息和移动计算领域具有重要意义,但其构建过程中也面临诸多挑战。首先,数据采集涉及隐私保护问题,如何在确保用户隐私的前提下收集和处理位置数据是一个复杂的问题。其次,数据集中的轨迹数据存在噪声和缺失,这要求研究者在分析时进行有效的数据清洗和预处理。此外,如何从海量的轨迹数据中提取有意义的行为模式和规律,也是该数据集应用中的一个重要挑战。
发展历史
创建时间与更新
GeoLife数据集由微软亚洲研究院于2007年创建,旨在研究人类移动模式。该数据集在2012年进行了重大更新,增加了更多的用户和详细的位置信息,使其成为地理信息系统和移动计算领域的重要资源。
重要里程碑
GeoLife数据集的一个重要里程碑是其在2012年的更新,这次更新不仅扩展了数据集的规模,还引入了更精细的时间戳和位置精度,极大地提升了数据集的研究价值。此外,GeoLife数据集在2015年被广泛应用于多个国际会议和期刊,成为评估和比较移动模式分析算法的标准数据集。这些里程碑事件标志着GeoLife在地理信息科学和移动计算领域的核心地位。
当前发展情况
当前,GeoLife数据集继续在地理信息系统和移动计算领域发挥重要作用。它被广泛用于研究人类移动模式、预测模型和位置隐私保护等前沿课题。随着技术的进步,GeoLife数据集也在不断更新和扩展,以适应新的研究需求。其对相关领域的贡献不仅体现在提供了丰富的实证数据,还推动了算法和模型的创新与发展,为未来的智能城市和移动服务提供了宝贵的理论和实践基础。
发展历程
  • GeoLife数据集首次发表,由微软亚洲研究院发布,包含182名用户在2007年至2012年间的GPS轨迹数据。
    2009年
  • GeoLife数据集被广泛应用于多个研究领域,包括地理信息系统、移动计算和人类行为分析。
    2011年
  • GeoLife数据集的扩展版本发布,增加了更多的用户和详细的轨迹信息,进一步丰富了数据集的内容。
    2013年
  • GeoLife数据集成为移动计算和位置服务领域的基准数据集,被大量研究论文引用和使用。
    2015年
  • GeoLife数据集的应用范围扩展至智能交通系统和城市规划领域,展示了其在多学科交叉研究中的价值。
    2018年
常用场景
经典使用场景
在地理信息科学领域,GeoLife数据集以其丰富的时空轨迹数据而著称。该数据集记录了用户在不同时间段内的地理位置信息,为研究人类移动模式提供了宝贵的资源。通过分析这些轨迹,研究者能够深入探讨个体和群体的移动行为,如日常通勤、旅游模式以及应急响应等。
实际应用
在实际应用中,GeoLife数据集被广泛用于城市规划、交通管理和应急响应等领域。通过分析用户的移动轨迹,城市规划者可以优化公共交通路线和设施布局,提升城市运行效率。交通管理者则可以利用这些数据来预测交通流量,制定有效的交通控制策略。在应急响应方面,GeoLife数据集能够帮助快速定位受影响区域,提高救援效率。
衍生相关工作
基于GeoLife数据集,许多经典工作得以展开。例如,研究者们开发了多种移动预测算法,显著提升了预测准确性。此外,该数据集还激发了对隐私保护和数据安全问题的深入研究,推动了相关技术的进步。在社会科学领域,GeoLife数据集也被用于研究人类行为和社会网络,产生了大量有影响力的学术成果。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录