geo-referenced-datasets
收藏github2020-03-04 更新2024-05-31 收录
下载链接:
https://github.com/viniciusmonteiro/geo-referenced-datasets
下载链接
链接失效反馈官方服务:
资源简介:
一个包含地理参考数据的公共数据集列表,关键词包括移动数据、签到、地理标记、轨迹等。
A public dataset list containing georeferenced data, with keywords including mobile data, check-in, geotagging, trajectory, etc.
创建时间:
2020-01-17
原始信息汇总
地理参考数据集
包含多种公共地理参考数据的数据集列表。
签到/地理标记数据
Foursquare
- NYC Restaurant:27149次签到,包含小贴士和标签,时间范围从2011年10月24日至2012年2月20日。
- NYC和东京:纽约市227,428次签到,东京573,703次签到,时间范围从2012年4月12日至2013年2月16日。
- 全球范围:33,278,683次签到,时间范围从2012年4月至2013年9月。
- NYC和东京用户资料:包含性别、朋友数、关注者数,纽约市8,201用户,东京11,874用户。
- 全球范围签到:22,809,624次签到和社交网络数据,时间范围从2012年4月至2014年1月。
Gowalla
- Gowalla:6,442,890次签到,时间范围从2009年2月至2010年10月。
- Gowalla:36,001,959次签到,时间范围为2011年6月。
- Tweet-geolocation-5m:超过500万条带有详细地理位置信息的推文。
Flickr
- Yahoo Flickr:9930万张图片和70万条视频,其中约4900万张图片带有地理标签。
汽车共享
- 汽车停放位置:每隔两分钟记录一次,持续数月。
起止点元组
- NYC Yellow Cab:442辆出租车行程记录,时间范围为2016年。
轨迹数据
- Geolife:多个用户的位置历史记录,182名用户,时间范围从2007年4月至2012年8月。
- 波尔图出租车轨迹:时间范围从2013年7月1日至2014年6月30日。
- Lisa:交通标志、车辆检测、交通灯和轨迹模式。
- 里约热内卢公交车GPS数据:56天数据。
海洋监测(AIS)
- 美国海岸
- 凯尔特海、海峡和比斯开湾,法国:时间范围从2015年10月1日至2016年3月31日。
- 丹麦海事
实时API
- 里约热内卢公交车GPS
- 洛杉矶停车咪表
搜集汇总
数据集介绍

构建方式
geo-referenced-datasets数据集的构建涉及广泛,涵盖了各类地理参照数据。该数据集通过收集不同来源的地理标记信息,如签到数据、轨迹数据以及实时API等,形成了一个多元化的数据集合,旨在为研究者提供丰富的地理信息资源。
特点
该数据集的特点在于数据的多样性与地理参照的精确性。它包含了数百万的签到记录、轨迹点以及图片和视频资料,跨越了全球多个城市和地区。此外,数据集还提供了与社交网络结合的签到信息,以及实时更新的交通和停车数据,为研究人类移动模式、城市规划和交通流量分析等领域提供了宝贵的资源。
使用方法
使用geo-referenced-datasets数据集时,用户可以根据需要选择不同类型的数据。例如,研究者可以访问Foursquare和Gowalla的签到数据,或是利用Twitter的地理位置标记推文。对于轨迹数据,用户可以分析出租车、公交车或是个人用户的移动轨迹。此外,通过实时API,用户还能够获取即时的交通和停车信息。在数据使用过程中,用户需遵循数据提供者的使用条款和隐私政策。
背景与挑战
背景概述
geo-referenced-datasets数据集的构建旨在汇聚各类含有地理位置信息的公共数据集,以促进地理信息系统(GIS)及其相关领域的研究。该数据集的创建涵盖了多个时期,由不同研究人员和机构所贡献,其中包含了如Foursquare、Gowalla、Twitter等社交平台上的签到数据,以及Yahoo Flickr上的图片和视频数据。该数据集自构建以来,已成为研究人类移动性、社会网络分析、城市规划和交通管理等领域的重要资源,对相关学科的发展产生了显著影响。
当前挑战
在构建geo-referenced-datasets数据集的过程中,研究人员面临了诸多挑战。首先,数据集的多样性和异质性使得整合和清洗工作变得复杂。其次,隐私保护是数据发布过程中的一个重要考量,需要对数据进行脱敏处理。此外,数据集的规模和动态更新特性也对存储和索引技术提出了更高的要求。在研究领域中,如何利用这些地理参照数据解决实际问题,如城市交通拥堵、环境污染监测等,也是当前研究的一大挑战。
常用场景
经典使用场景
在地理信息系统与人类行为分析领域,geo-referenced-datasets数据集因其详尽的地理参考信息而被广泛使用。研究者通常将其应用于挖掘用户的移动模式、社交行为及地理空间的相互关系。
解决学术问题
该数据集解决了如何从大规模地理标注数据中提取有效信息,分析人类活动模式与地理环境相互作用的问题,为城市规划、公共安全以及市场分析等提供了重要支撑。
衍生相关工作
基于该数据集,研究者衍生出了一系列相关工作,如社交网络分析、人类移动模式预测、城市热力图绘制等,这些工作进一步拓展了地理信息数据的学术与应用价值。
以上内容由遇见数据集搜集并总结生成



