five

Weibo and Twitter

收藏
DataCite Commons2024-04-29 更新2025-04-16 收录
下载链接:
https://ieee-dataport.org/documents/weibo-and-twitter
下载链接
链接失效反馈
官方服务:
资源简介:
Weibo and Twitter1)The Weibo dataset is derived from the Weibo social platform. The collection of true information in this dataset originates from authoritative Chinese sources, while fake information is acquired through the official Weibo rumor suppression system. Each data instance within this dataset comprises both a news text and a corresponding news image.2)The Twitter dataset is sourced from the Twitter social platform. Each tweet's content consists of a concise text message and additional images or videos. The development set encompasses around 6,000 rumors and 5,000 non-rumor tweets, stemming from 11 rumor-related events. Each data instance in this dataset includes both a news text and a corresponding news image.They are split into 7:1:2 ratios for training, validation, and test sets.

微博与推特数据集: 1) 微博(Weibo)数据集源自微博社交平台。该数据集的真实信息采集自中国权威信源,虚假信息则通过微博官方辟谣系统获取,每个数据实例均包含新闻文本与对应新闻图片。 2) 推特(Twitter)数据集源自推特社交平台。每条推文的内容由简短文本消息及附加图片或视频组成,其开发集涵盖约6000条谣言与5000条非谣言推文,数据来自11起涉谣事件,该数据集的每个数据实例同样包含新闻文本与对应新闻图片。 两个数据集均按照7:1:2的比例划分为训练集、验证集与测试集。
提供机构:
IEEE DataPort
创建时间:
2024-04-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含来自微博和Twitter两个平台的社交媒体数据,微博数据包括来自权威中文来源的真实信息和微博辟谣系统的虚假信息,每条数据都包含文本和图片;Twitter数据包含约6000条谣言和5000条非谣言推文,来自11个相关事件,每条数据也包含文本和图片。数据集按7:1:2的比例划分为训练集、验证集和测试集,适用于谣言检测等研究领域。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作