five

Davidson et al. (Twitter tweets)

收藏
arXiv2025-09-30 收录
下载链接:
https://www.dropbox.com/sh/5ud4fwxvb6q7k20/AAAH_SN8i5cfmJRKJteEW2b2a
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了从8500万条推文中筛选出的2.5万条包含Hatebase词汇的推文。其中,CrowdFlower的工作人员手动将这2.5万条推文中的24,802条划分为三个类别:仇恨言论、具有攻击性但非仇恨言论,以及既不攻击性也不属于仇恨言论。该任务的目的是进行仇恨言论分类。

This dataset includes 25,000 tweets containing Hatebase vocabulary, filtered from 85 million original tweets. Among these 25,000 tweets, 24,802 were manually categorized by CrowdFlower staff into three classes: hate speech, offensive but non-hate speech, and neither offensive nor hate speech. The objective of this task is hate speech classification.
提供机构:
CrowdFlower
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作