Chinese_Rumor_Dataset
收藏Opencsg2024-04-30 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/MagicAI/Chinese_Rumor_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
第一部分数据集(./rumors_v170613.json)共包含从2009年9月4日至2017年6月12日的31669条谣言。文件中,每一行为一条json格式的谣言数据,字段释义如下:
rumorCode: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。
title: 该条谣言被举报的标题内容
informerName: 举报者微博名称
informerUrl: 举报者微博链接
rumormongerName: 发布谣言者的微博名称
rumormongerUr: 发布谣言者的微博链接
rumorText: 谣言内容
visitTimes: 该谣言被访问次数
result: 该谣言审查结果
publishTime: 该谣言被举报时间
The first dataset (./rumors_v170613.json) contains a total of 31,669 rumor records spanning from September 4, 2009 to June 12, 2017. Each line in the file is a rumor record in JSON format, with the following field explanations:
- rumorCode: Unique identifier for each individual rumor, which can be used to directly access the report page of the corresponding rumor.
- title: Title content of the reported rumor.
- informerName: Username of the whistleblower on Weibo.
- informerUrl: Link to the whistleblower's Weibo profile.
- rumormongerName: Username of the rumor publisher on Weibo.
- rumormongerUr: Link to the rumor publisher's Weibo profile.
- rumorText: Specific content of the rumor.
- visitTimes: Total number of times the rumor has been accessed.
- result: Review result of the verified rumor.
- publishTime: Time when the rumor was reported.
创建时间:
2024-04-30
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是从新浪微博不实信息举报平台抓取的中文谣言数据,包含两部分:第一部分是谣言原微博数据集,涵盖2009年至2017年的31669条谣言,提供标题、内容、审查结果等字段;第二部分是CED_Dataset,包含谣言和非谣言的转发与评论信息,共3387条,适用于谣言传播和检测研究。数据集结构清晰,来源权威,适合用于自然语言处理和社会媒体分析任务。
以上内容由遇见数据集搜集并总结生成



