white_internet.xlsx
收藏github2025-11-27 更新2025-11-28 收录
下载链接:
https://github.com/tasokait/white_internet_database
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于伊朗人使用白互联网的Twitter账户数据库,包含ID、姓名、账户ID变更次数、最后变更时间、注册时间、账户删除状态(0表示已删除,1表示存在)、设备类型(0为Android,1为iPhone,2为Web)、Twitter坐标状态(0无国家标记,1有i标记国家,2有VPN标记国家)和性别(0为男性,1为女性,2为未知)等列,设计用于方便导入统计软件进行分析。
This is a Twitter account database for Iranian users accessing the clearnet. It includes columns such as ID, full name, number of Twitter handle changes, last change timestamp, registration timestamp, account deletion status (0 = deleted, 1 = active), device type (0 = Android, 1 = iPhone, 2 = Web), Twitter geotagging status (0 = no country tag, 1 = country tag via i, 2 = country tag via VPN), and gender (0 = male, 1 = female, 2 = unknown). It is designed for easy import into statistical software for analysis.
创建时间:
2025-11-24
原始信息汇总
White Internet Database 数据集概述
数据集基本信息
- 数据集名称: White Internet Database
- 存储格式: Excel文件 (white_internet.xlsx)
- 当前状态: 未完成,可能存在不完整内容
数据列说明
- 第一列: 用户ID
- 第二列: 用户名
- 第三列: 用户更换ID的次数
- 第四列: 最后一次更换ID的时间
- 第五列: 注册时间
- 第六列: 账户删除状态
- 0: 已删除
- 1: 仍存在
- 第七列: 设备类型
- 0: Android
- 1: iPhone
- 2: Web
- 第八列: Twitter坐标状态
- 0: 国家名称旁无标记
- 1: 国家名称旁有"i"标记
- 2: 国家名称旁有VPN标记
- 第九列: 性别
- 0: 男性
- 1: 女性
- 2: 未知
数据收集说明
- 数值编码设计便于后续导入统计软件(如MATLAB)进行分析
- 数据集目前为初步展示版本
- 如有遗漏ID,可通过Twitter联系 @tasokait 补充
注意事项
- 数据集尚在开发完善中
- 可能存在数据不完整情况
搜集汇总
数据集介绍

构建方式
在社交媒体数据分析领域,white_internet.xlsx数据集的构建采用了系统化的数据采集方法。该数据集通过结构化表格形式记录用户行为数据,包含九个关键字段:用户ID、用户名、ID更换次数、最后更换时间、注册时间、账户状态、设备类型、地理位置标识和性别分类。数据编码采用数值化处理,便于后续统计分析工具的直接调用,这种设计体现了数据科学中常见的预处理规范。
特点
该数据集展现出多维度的用户特征刻画能力,其独特之处在于将复杂的社交行为转化为可量化的指标。账户状态采用二进制编码(0表示已删除,1表示活跃),设备类型细分为安卓、iOS和网页端三类,地理位置标识通过三级分类体系区分原始定位、国家标识和VPN使用情况。性别字段采用三分类编码,既保障了数据处理的效率,又保持了用户隐私的合理保护。
使用方法
针对数据挖掘研究需求,该数据集可直接导入专业统计软件进行分析。研究人员可通过Excel或兼容的统计工具加载数据文件,利用各字段的数值编码特性进行交叉分析和模式识别。建议在使用前验证数据完整性,并根据研究目的选择相应字段组合。对于账户动态行为研究,可重点关注ID更换频率与设备类型的关联分析;而用户画像构建则可综合利用地理位置、性别和设备类型等多维特征。
背景与挑战
背景概述
在社交媒体分析领域,数据集的构建对于理解用户行为模式具有关键意义。white_internet.xlsx数据集由研究人员@tasokait主导创建,聚焦于Twitter平台用户活动追踪,核心研究问题在于揭示用户身份变更、设备使用偏好及地理定位特征对社交网络动态的影响。该数据集通过系统记录用户ID、注册时间、账户状态及设备类型等变量,为探索数字身份管理与在线行为交互提供了实证基础,推动了社交媒体生态研究的深入发展。
当前挑战
该数据集旨在解决社交媒体用户行为分析的复杂性挑战,包括准确识别用户身份变更模式与设备关联性,但构建过程中面临数据完整性不足和标注一致性问题,例如部分字段缺失或初始记录不完整导致分析偏差。同时,多维度变量如地理位置状态和性别分类的标准化处理增加了数据整合难度,需进一步优化以确保统计工具兼容性与可靠性。
常用场景
经典使用场景
在社交媒体分析领域,white_internet.xlsx数据集为研究用户行为模式提供了关键支持。该数据集通过记录用户ID变更频率、设备类型及地理位置标识等结构化信息,典型应用于探索社交平台上的账户动态特征,例如分析用户更换账户的周期性规律或设备偏好,为理解虚拟身份管理行为奠定数据基础。
衍生相关工作
基于该数据集衍生的经典研究多聚焦于跨文化网络行为比较。例如,结合账户生命周期与设备类型数据,学者开发了动态身份可信度评估模型;另有工作通过地理标识与性别变量关联分析,揭示了不同社会背景下用户匿名策略的差异性,为跨国社交媒体治理研究提供了新范式。
数据集最近研究
最新研究方向
在社交媒体数据分析领域,white_internet.xlsx数据集聚焦于用户行为动态与身份管理模式的探索。前沿研究主要围绕用户身份切换频率与设备类型关联性展开,结合性别和地理位置标记,揭示网络匿名性对在线互动的影响。热点事件如虚拟专用网络使用激增,推动了数据集中坐标状态分析的深化,旨在识别区域化网络管控趋势。这些研究不仅增强了社交媒体生态系统的理解,还为平台治理和用户隐私保护策略提供了实证基础,具有显著的跨学科应用潜力。
以上内容由遇见数据集搜集并总结生成



