A_Dataset_of_State-Censored_etc
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/A_Dataset_of_State-Censored_etc
下载链接
链接失效反馈官方服务:
资源简介:
这是 2012 年至 2020 年 7 月期间审查的 155,715 名用户的 583,437 条推文的数据集。它还包含 4,301 个全部被审查的帐户。此外,另一组推文是相关的,由 22,083,759 条补充推文组成,这些补充推文由至少有一条审查推文的用户的所有推文以及其他用户转发审查用户的实例组成。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集收集了2012年至2020年7月期间国家审查的推文,包含155,715名用户的583,437条被审查推文和4,301个完全被审查的账户,并提供了22,083,759条相关补充推文。它由洛桑联邦理工学院于2021年发布,适用于文本分类和自然语言处理分析。
以上内容由遇见数据集搜集并总结生成



