five

NetMob2024 Dataset

收藏
arXiv2024-10-03 更新2024-10-09 收录
下载链接:
https://arxiv.org/pdf/2410.00453v2
下载链接
链接失效反馈
官方服务:
资源简介:
NetMob2024数据集是由世界银行与Cuebiq合作开发的,涵盖了四个低收入和中等收入国家(哥伦比亚、印度尼西亚、印度和墨西哥)在2019年和2020年的时空数据。该数据集通过隐私保护的聚合数据,从自愿同意匿名数据收集的移动应用用户中获取。数据集包括设备位置数据和轨迹数据,用于生成人口密度和起源-目的地矩阵。数据集的创建过程涉及空间和时间编码,以保护个人隐私。该数据集主要应用于交通规划、灾难恢复、流行病响应、社会经济分析和旅游研究等领域,旨在解决数据稀缺国家中的数据缺口问题。

The NetMob2024 dataset was developed in collaboration between the World Bank and Cuebiq, covering spatio-temporal data from four low- and middle-income countries (Colombia, Indonesia, India, and Mexico) spanning 2019 and 2020. This dataset is acquired through privacy-protected aggregated data collected from mobile application users who have voluntarily consented to anonymous data collection. It includes device location data and trajectory data, which are used to generate population density and origin-destination matrices. The creation of this dataset involves spatial and temporal encoding to safeguard individual privacy. This dataset is primarily applied in fields including transportation planning, disaster recovery, pandemic response, socio-economic analysis, and tourism research, aiming to address data gaps in data-scarce countries.
提供机构:
世界银行
创建时间:
2024-10-01
搜集汇总
数据集介绍
main_image_url
构建方式
NetMob2024数据集通过与Cuebiq合作,利用用户自愿提供的移动应用数据构建而成。该数据集涵盖了四个低收入和中等收入国家(哥伦比亚、印度尼西亚、印度和墨西哥)在2019年和2020年的时空数据。数据经过隐私保护处理,通过Cuebiq的Spectus数据清洁室平台进行分析,包括设备位置数据、检测到的停留位置和用户轨迹。数据集通过空间编码和时间聚合来保护个人隐私,使用Geohash和H3系统进行空间编码,并按3小时、每日、每周和每月进行时间聚合。
特点
NetMob2024数据集的独特之处在于其涵盖了多个国家的广泛时空数据,为研究者提供了前所未有的数据规模和多样性。数据集包括人口密度(PD)和起源-目的地(OD)矩阵,这些数据经过隐私保护处理,确保用户隐私的同时提供高质量的研究数据。此外,数据集提供了不同空间分辨率(如Geohash 3和Geohash 5)和时间间隔(如3小时、每日、每周和每月)的聚合数据,满足不同研究需求。
使用方法
NetMob2024数据集适用于多种学术领域的研究,包括交通规划、灾害恢复、流行病响应、社会经济分析和旅游研究。研究者可以通过分析人口密度数据来了解城市和国家的空间分布特征,通过起源-目的地矩阵来研究人口流动模式。数据集提供了详细的使用指南和示例,帮助研究者快速上手并进行有效的数据分析。此外,数据集还提供了与其他数据源(如人口普查数据、气候数据等)结合使用的建议,以增强研究的深度和广度。
背景与挑战
背景概述
NetMob2024数据集由世界银行、伦敦大学学院和巴黎综合理工学院的研究人员于2024年共同创建,旨在为低收入和中等收入国家(LMIC)提供全面的时空数据。该数据集涵盖了哥伦比亚、印度尼西亚、印度和墨西哥四个国家,时间跨度为2019年至2020年。通过与Cuebiq合作,该数据集利用移动应用程序数据,经过隐私保护的聚合处理,提供了人口密度和起源-目的地矩阵。这一数据集的创建旨在促进新研究方法的产生和研究结果的可重复性,特别是在交通规划、灾难恢复、流行病响应、社会经济分析和旅游业等领域。
当前挑战
NetMob2024数据集在解决领域问题方面面临多项挑战。首先,确保数据隐私和安全是核心问题,特别是在处理敏感的移动数据时。其次,开发新的数据分析方法以应对大数据环境中的复杂性是另一大挑战。此外,数据集在构建过程中也遇到了代表性问题,由于数据主要来自智能手机用户,可能无法全面反映低收入和中等收入国家的所有人口特征。最后,数据生成过程的动态变化,如应用程序数据的加入或退出,可能导致数据的不稳定性,影响分析的准确性。
常用场景
经典使用场景
NetMob2024数据集在多个学术领域中提供了独特的时空数据分析机会,特别是在人口密度和起源-目的地矩阵的构建上。该数据集涵盖了哥伦比亚、印度尼西亚、印度和墨西哥四个国家,跨越2019和2020两年,为研究人员提供了丰富的数据资源。通过这些数据,研究者可以深入分析城市和国家的移动模式,从而为交通规划、灾难恢复、流行病响应、社会经济分析和旅游业研究提供有力支持。
衍生相关工作
NetMob2024数据集的发布催生了一系列相关研究工作,特别是在利用移动数据进行社会经济分析和旅游业研究方面。例如,研究者利用该数据集分析了不同城市的游客流动模式,评估了自然灾害对消费行为的影响,并探讨了移动数据在贫困分布和多维贫困指数估计中的应用。这些研究不仅扩展了移动数据的应用领域,也为相关政策的制定提供了科学依据。
数据集最近研究
最新研究方向
在移动技术广泛应用的背景下,NetMob2024数据集为研究者提供了前所未有的机会,通过移动设备和应用程序生成的数据来分析大规模的人类行为,特别是移动性。该数据集涵盖了四个低收入和中等收入国家(哥伦比亚、印度尼西亚、印度和墨西哥)在2019和2020年的时空数据,为研究交通规划、灾难恢复、流行病响应、社会经济分析和旅游业提供了丰富的资源。通过这些数据,研究者可以开发新的分析方法,提升对城市和国家的移动模式的理解,从而为公共政策的制定和优化提供科学依据。此外,数据集的隐私保护措施确保了用户数据的安全,为在大数据环境下进行负责任的研究奠定了基础。
相关研究论文
  • 1
    The NetMob2024 Dataset: Population Density and OD Matrices from Four LMIC Countries世界银行 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作