Swarm App用户数据集
收藏github2018-08-31 更新2024-05-31 收录
下载链接:
https://github.com/chenyang03/Swarm_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含超过6000万Swarm App用户的详细信息,包括用户的朋友列表和每个用户的总签到次数。
This dataset comprises detailed information of over 60 million Swarm App users, including their friends lists and the total number of check-ins per user.
创建时间:
2017-09-29
原始信息汇总
Anonymized Swarm App User Dataset
Overview
- Size: Over 60 million users
- Content: Includes friend lists and total check-ins for each user
Data Components
-
Check-in Numbers:
- File:
check-in_nums.tar.gz - Format: Each line in
checkins_info.txtcontains a pair (anonymized_user_ID, check-in_number) - Example:
32, 9334indicates user ID 32 has 9334 check-ins
- File:
-
Friend Lists:
- File:
friends.tar.gz - Format: Each line in
friends_add_edges.txtstarts with an anonymized user ID, followed by the number of friends and their IDs - Example:
23 5 123 3 9909 1233 123shows user ID 23 has 5 friends with IDs 123, 3, 9909, 1233, and 123
- File:
License
- Type: Creative Commons Attribution Share Alike 4.0
搜集汇总
数据集介绍

构建方式
Swarm App用户数据集的构建,基于对数以亿计的用户行为记录进行匿名化处理。数据集涵盖了超过6000万用户的社交网络信息,包括用户的好友列表以及每个用户的签到总数。构建过程中,开发者将用户的个人信息匿名化,保证了数据的安全性和隐私性,同时保留了用户社交网络的基本结构和行为特征。
特点
该数据集的特点在于其庞大的规模和详尽的用户行为记录。不仅包含了用户的基本社交网络结构,还提供了用户的签到活动数据,为研究大规模社交网络动态和用户行为模式提供了丰富的信息资源。此外,数据集遵循Creative Commons Attribution Share Alike 4.0许可,允许研究者在遵守规定的前提下自由使用和共享数据。
使用方法
使用该数据集时,研究者可以通过提供的下载链接获取数据,其中包含了签到的数量和用户的好友列表。数据以文本文件形式存储,格式简洁明了,便于研究者进行数据清洗和分析。例如,`checkins_info.txt`文件中每行记录了一个用户的ID和其签到次数,而`friends_add_edges.txt`文件则记录了用户ID、好友数量以及好友ID列表,研究者可根据这些信息进行社交网络分析和挖掘。
背景与挑战
背景概述
Swarm App用户数据集是一款涵盖600万以上Swarm App用户的匿名数据集,由研究人员Yang Chen、Jiyao Hu、Hao Zhao、Yu Xiao和Pan Hui于2018年创建。该数据集包含用户的好友列表和每个用户的签到总数,旨在对Swarm社交网络进行测量与分析。作为IEEE Access期刊上发表的研究成果的一部分,该数据集为社交网络分析、用户行为研究以及大规模网络结构分析等领域提供了宝贵的资源,对相关学术研究产生了显著影响。
当前挑战
该数据集在构建过程中面临的挑战主要包括用户隐私保护与数据匿名化处理,确保发布的数据不泄露用户个人信息。此外,数据集的规模巨大,对存储和计算资源提出了较高的要求。在研究领域,如何从海量的签到数据中提取有价值的信息,以及如何准确分析社交网络中的复杂关系结构,是当前研究人员面临的挑战。
常用场景
经典使用场景
在社交网络分析领域,Swarm App用户数据集以其海量的用户信息和社交连接属性,成为研究社会网络结构和用户行为模式的重要资源。该数据集的经典使用场景主要涉及对大规模社交网络的拓扑结构进行量化分析,探究用户间的社交互动和位置签到行为,从而揭示用户行为的时空特征和社会网络动态。
衍生相关工作
基于Swarm App用户数据集,研究者已开展了大量相关工作,如挖掘社交网络中的关键节点、分析用户签到的时空模式、构建用户行为预测模型等。这些研究不仅丰富了社交网络分析的理论体系,也为实际应用提供了科学依据和技术支持。
数据集最近研究
最新研究方向
Swarm App用户数据集作为社会网络分析领域的重要资源,近期研究主要聚焦于大规模社交网络结构特性及用户行为模式的研究。该数据集覆盖超过六千万用户的社交关系和签到行为,为探索社交网络演化、信息传播机制以及个体影响力分析提供了坚实基础。研究者通过分析该数据集,揭示了用户签到行为与社交网络结构之间的内在联系,为城市计算和个性化推荐系统提供了新的视角。此外,该数据集对于理解大规模社交网络中用户行为的动态变化及其对社交网络结构的影响,具有重要的理论与实践意义。
以上内容由遇见数据集搜集并总结生成



