TwiBot-22
收藏arXiv2025-09-30 收录
下载链接:
https://twibot22.github.io/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为TwiBot-22,是一个基于图的全面的推特机器人检测基准,它提供了迄今为止最大的数据集,涵盖了推特网络中多样化的实体和关系,其标注质量显著优于现有数据集。该数据集采用了弱监督学习策略来生成高质量的标签,并通过多种采样策略确保了不同类型用户的代表性。数据集的规模包括9293万节点和1.7019亿条边,其任务是进行推特机器人检测。
The dataset named TwiBot-22 is a comprehensive graph-based benchmark for Twitter bot detection. It features the largest-scale dataset to date, covering diverse entities and relationships within Twitter networks, and its annotation quality markedly outperforms existing datasets. This dataset employs a weak supervision learning strategy to generate high-quality labels, and adopts multiple sampling strategies to ensure the representativeness of different user categories. With a scale of 92.93 million nodes and 170.19 million edges, the core task of this benchmark is Twitter bot detection.
提供机构:
TwiBot-22
搜集汇总
数据集介绍

背景与挑战
背景概述
TwiBot-22是一个大规模、基于图的Twitter机器人检测数据集,提供了多样化的实体和关系以及高质量的标注,是目前该领域最大的基准数据集。它还包含35种基线方法的重新实现和评估框架,旨在促进图基机器人检测方法的研究和公平比较。
以上内容由遇见数据集搜集并总结生成



