WeChatNet
收藏arXiv2018-02-24 更新2024-06-21 收录
下载链接:
https://github.com/pkumobile/WMdata
下载链接
链接失效反馈资源简介:
WeChatNet是由北京大学收集的数据集,包含了25,133,330名微信用户在2016年1月14日至2月27日期间在其页面上进行的246,369,415次链接转发记录。该数据集首次公开了微信朋友圈用户转发行为的大数据。数据集的创建过程涉及使用API从商业微信页面创建平台爬取扩散轨迹,构建每个发布的微信页面的扩散图。WeChatNet的应用领域包括移动蜂窝网络中的信息传播、骨干网络的流量预测以及移动人口分布的投影,旨在解决在线社交行为对计算机网络和线下行为的影响问题。
WeChatNet is a dataset collected by Peking University, which encompasses 246,369,415 link forwarding records generated by 25,133,330 WeChat users on their WeChat Moments pages between January 14 and February 27, 2016. This dataset is the first to publicly release large-scale data regarding the forwarding behaviors of WeChat Moments users. The dataset was developed by crawling diffusion trajectories from commercial WeChat page creation platforms via APIs, and constructing diffusion graphs for each published WeChat page. Its application fields include information propagation in mobile cellular networks, traffic prediction of backbone networks, and projection of mobile population distribution, aiming to address the impacts of online social behaviors on computer networks and offline behaviors.
提供机构:
北京大学
创建时间:
2017-10-21
AI搜集汇总
数据集介绍

构建方式
WeChatNet数据集通过从微信朋友圈(WeChat Moments)中收集用户链接转发记录构建而成。研究团队利用FIBODATA平台提供的API,爬取了2016年1月14日至2月27日期间创建的约320,000个页面的扩散轨迹,涉及25,133,330名微信用户和246,369,415条链接转发记录。通过这些数据,构建了每个微信朋友圈页面的扩散图,从而形成了这一庞大的社交网络数据集。
特点
WeChatNet数据集的显著特点在于其庞大的用户基础和丰富的互动数据,涵盖了超过2500万用户的社交行为。该数据集不仅记录了用户之间的链接转发行为,还捕捉了信息在社交网络中的传播路径,为研究信息扩散、网络流量预测和移动人口分布提供了宝贵的资源。此外,数据集中的隐私保护机制,如限制非好友访问页面内容,增加了数据的安全性和研究的可信度。
使用方法
WeChatNet数据集可用于多种网络应用研究,包括移动蜂窝网络中的信息传播、骨干网络流量预测和移动人口分布投影。研究者可以通过分析用户间的互动模式,识别具有高影响力的用户,优化信息传播策略。此外,该数据集还可用于预测网络流量分布,通过观察用户在时间和空间域内的互动,实现资源的精细化分配。对于人口分布研究,数据集提供了基于在线行为推测地理分布的模型,有助于制定区域营销策略和个性化推荐服务。
背景与挑战
背景概述
随着移动技术的迅猛发展,移动社交网络(MSN)服务引领我们进入了一个移动社交大数据时代,人们每时每刻都在创造新的社交数据。企业和政府机构迫切需要理解在线行为如何影响底层计算机网络或其线下行为。为此,研究人员从微信朋友圈收集了一个名为WeChatNet的数据集,涉及25,133,330名微信用户和246,369,415条链接转发记录。该数据集的创建旨在研究信息在移动蜂窝网络中的传播、骨干网络流量预测以及移动人口分布投影等网络应用。WeChatNet数据集的发布为相关领域的研究提供了宝贵的资源,推动了对移动社交网络行为的深入理解。
当前挑战
WeChatNet数据集在构建和应用过程中面临多项挑战。首先,微信朋友圈的访问控制策略限制了信息的扩散,使得研究信息传播和转发行为变得复杂。其次,移动蜂窝网络中用户之间的连接质量未知,影响了信息传播的可靠性。此外,骨干网络流量预测需要精细分析用户互动频率,以实现资源的优化分配。最后,移动人口分布的预测依赖于在线行为的地理属性,而大规模迁移事件如春节可能导致社交网络结构的显著变化,增加了预测的难度。这些挑战要求研究者开发新的分析方法和模型,以充分利用WeChatNet数据集的潜力。
常用场景
经典使用场景
WeChatNet数据集的经典使用场景主要集中在移动社交网络的信息传播分析上。通过分析用户在微信朋友圈中的链接转发行为,研究者能够深入探讨信息在移动社交网络中的传播机制,特别是在移动蜂窝网络中的信息扩散模式。此外,该数据集还被用于预测骨干网络的流量分布,以及移动人口的分布投影,为网络资源优化和市场策略制定提供了重要依据。
解决学术问题
WeChatNet数据集解决了移动社交网络研究中的多个关键学术问题。首先,它为研究信息在移动蜂窝网络中的传播提供了实证数据,有助于理解信息扩散的影响因素和路径。其次,通过分析用户的转发行为,该数据集支持了对骨干网络流量预测的研究,提高了网络资源分配的效率。此外,它还为移动人口分布的预测提供了新的视角,有助于社会科学和市场营销领域的研究。
衍生相关工作
WeChatNet数据集的发布催生了一系列相关研究工作。例如,研究者利用该数据集开发了新的信息扩散模型,以更好地理解社交网络中的信息传播机制。此外,基于该数据集的研究还推动了移动人口分布预测模型的发展,为社会科学研究提供了新的工具。同时,该数据集也为隐私保护和网络安全研究提供了新的数据支持,促进了相关领域的技术进步。
以上内容由AI搜集并总结生成



