five

Chinese_Rumor_Dataset

收藏
Opencsg2024-04-30 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/MagicAI/Chinese_Rumor_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
第一部分数据集(./rumors_v170613.json)共包含从2009年9月4日至2017年6月12日的31669条谣言。文件中,每一行为一条json格式的谣言数据,字段释义如下: rumorCode: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。 title: 该条谣言被举报的标题内容 informerName: 举报者微博名称 informerUrl: 举报者微博链接 rumormongerName: 发布谣言者的微博名称 rumormongerUr: 发布谣言者的微博链接 rumorText: 谣言内容 visitTimes: 该谣言被访问次数 result: 该谣言审查结果 publishTime: 该谣言被举报时间

The first dataset (./rumors_v170613.json) contains a total of 31,669 rumor records spanning from September 4, 2009 to June 12, 2017. Each line in the file is a rumor record in JSON format, with the following field explanations: - rumorCode: Unique identifier for each individual rumor, which can be used to directly access the report page of the corresponding rumor. - title: Title content of the reported rumor. - informerName: Username of the whistleblower on Weibo. - informerUrl: Link to the whistleblower's Weibo profile. - rumormongerName: Username of the rumor publisher on Weibo. - rumormongerUr: Link to the rumor publisher's Weibo profile. - rumorText: Specific content of the rumor. - visitTimes: Total number of times the rumor has been accessed. - result: Review result of the verified rumor. - publishTime: Time when the rumor was reported.
创建时间:
2024-04-30
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是从新浪微博不实信息举报平台抓取的中文谣言数据,包含两部分:第一部分是谣言原微博数据集,涵盖2009年至2017年的31669条谣言,提供标题、内容、审查结果等字段;第二部分是CED_Dataset,包含谣言和非谣言的转发与评论信息,共3387条,适用于谣言传播和检测研究。数据集结构清晰,来源权威,适合用于自然语言处理和社会媒体分析任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作