ctoraman/large-scale-hate-speech
收藏Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ctoraman/large-scale-hate-speech
下载链接
链接失效反馈官方服务:
资源简介:
该存储库包含在LREC 2022论文《大规模仇恨言论检测与跨领域转移》中使用的数据集。该研究主要关注土耳其语和英语中的仇恨言论检测。此外,还研究了不同仇恨领域之间的转移成功。数据集有两个版本:v1版本包含每种语言(英语和土耳其语)10万条推文,注释一致性超过60%;v2版本包含68,597条英语推文和60,310条土耳其语推文,注释一致性超过80%。
该存储库包含在LREC 2022论文《大规模仇恨言论检测与跨领域转移》中使用的数据集。该研究主要关注土耳其语和英语中的仇恨言论检测。此外,还研究了不同仇恨领域之间的转移成功。数据集有两个版本:v1版本包含每种语言(英语和土耳其语)10万条推文,注释一致性超过60%;v2版本包含68,597条英语推文和60,310条土耳其语推文,注释一致性超过80%。
提供机构:
ctoraman
原始信息汇总
数据集概述
许可证
- 许可证类型:cc
任务类别
- 文本分类
语言
- 英语
- 土耳其语
标签
- 仇恨言论
- 仇恨言论检测
数据集名称
- 名称:h
数据集大小
- 大小范围:100K<n<1M
数据集版本
-
Dataset v1:
- 包含100,000条推文(英语和土耳其语各100,000条)
- 标注一致性超过60%
- 发布于LREC 2022
-
Dataset v2:
- 包含68,597条英语推文和60,310条土耳其语推文
- 标注一致性超过80%



