twitter fake news datasets
收藏Mendeley Data2024-01-31 更新2024-06-29 收录
下载链接:
https://www.scidb.cn/en/detail?dataSetId=884c601119094406934408192b591c01
下载链接
链接失效反馈官方服务:
资源简介:
The main directory contains the directories of two Twitter datasets: twitter15 and twitter16. In each directory, there are:- 'tree' sub-directory: This folder contains all the tree files, each of which corresponds to the tree structure given a source tweet whose file name is indicated by the source tweet ID. In the tree file, each line represents an edge given in the following format: ** parent node -> child node ** Each node is given as a tuple: ['uid', 'tweet ID', 'post time delay (in minutes)'] - label.txt file: This file provides the ground-truth labels of the trees in a format like: ** 'label:source tweet ID' - source_tweets.txt file: This file provides the source posts content of the trees in a format like: ** 'source tweet ID \t source tweet content'
主目录包含两个Twitter数据集的目录:twitter15与twitter16。在每个目录内,均包含以下内容:
- 'tree'子目录:该文件夹存储所有树结构文件,每个文件对应一条源推文的传播树结构,文件名由该源推文的ID命名。树文件中每一行代表一条边,格式为**父节点 -> 子节点**。每个节点以元组形式表示:['用户ID(uid)', '推文ID', '发布时延(单位:分钟)']
- label.txt文件:该文件提供各树结构的真实标签,格式为**'标签:源推文ID'**
- source_tweets.txt文件:该文件提供各树对应的源推文内容,格式为**'源推文ID 源推文内容'**
创建时间:
2024-01-31
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含两个Twitter虚假新闻数据集(twitter15和twitter16),提供树结构、标签和源推文内容,用于虚假新闻检测研究。数据集大小为12.18 MB,发布于2023年3月29日。
以上内容由遇见数据集搜集并总结生成



