five

The offensive speech in Weibo and data analysis code

收藏
Mendeley Data2024-06-20 更新2024-06-26 收录
下载链接:
https://data.mendeley.com/datasets/d9659xgx4v
下载链接
链接失效反馈
官方服务:
资源简介:
There are the dataset of offensive speech and the codes to analysis this dataset including SNA an Association Analysis. The dataset were the discussions on Weibo around the “Hot Search” hashtags ranking (i.e., the hashtags with the highest search volume and discussion popularity within a certain period) from July 2022 to July 2023. The social network consisting of 65321 nodes and 83203 edges including 2488 offensive edges. Specifically, there were 17194 posts (4406 with @), 19219 re-posts (3070 with @), 31378 comments and 11515 secondary comments. The number of offensive edges was 1058, 337, 164, 33, 538, and 358 respectively.

本数据集包含攻击性言论数据与配套分析代码,分析方法涵盖社会网络分析(Social Network Analysis,SNA)与关联分析。该数据集涵盖2022年7月至2023年7月期间,微博平台上围绕“热搜”话题标签(即特定时段内搜索量与讨论热度最高的话题标签)产生的相关讨论内容。其所构建的社交网络包含65321个节点与83203条边,其中2488条为攻击性边。具体而言,该数据集包含17194条原帖(其中4406条带有@提及)、19219条转发帖(其中3070条带有@提及)、31378条一级评论以及11515条二级评论,各对应类别下的攻击性边数量依次为1058、337、164、33、538与358。
创建时间:
2024-06-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作