five

A_Dataset_of_State-Censored_etc

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/A_Dataset_of_State-Censored_etc
下载链接
链接失效反馈
官方服务:
资源简介:
这是 2012 年至 2020 年 7 月期间审查的 155,715 名用户的 583,437 条推文的数据集。它还包含 4,301 个全部被审查的帐户。此外,另一组推文是相关的,由 22,083,759 条补充推文组成,这些补充推文由至少有一条审查推文的用户的所有推文以及其他用户转发审查用户的实例组成。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集收集了2012年至2020年7月期间国家审查的推文,包含155,715名用户的583,437条被审查推文和4,301个完全被审查的账户,并提供了22,083,759条相关补充推文。它由洛桑联邦理工学院于2021年发布,适用于文本分类和自然语言处理分析。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作