SALT-NLP/ImplicitHate
收藏数据集概述:Implicit Hate Speech
数据集名称
Implicit Hate Speech
数据集描述
该数据集包含来自美国最突出极端主义团体的22,056条推文,其中6,346条包含隐性仇恨言论。隐性仇恨类别通过以下分类进行分解:
- Grievance (24.2%): 对少数群体的特权感到不满。
- Incitement (20.0%): 间接推广已知的仇恨团体和意识形态。
- Inferiority (13.6%): 暗示某些群体或个人价值低于其他。
- Irony (12.6%): 使用讽刺、幽默和讽刺来贬低某人。
- Stereotypes (17.9%): 使用委婉语、迂回或比喻语言将群体与负面属性关联。
- Threats (10.5%): 间接承诺攻击某人的身体、福祉、名誉、自由等。
- Other (1.2%): 其他。
每条6,346条隐性仇恨推文还包括目标人口群体和隐含声明的自由文本注释,以描述潜在信息。
数据集用途
该数据集可用于训练最先进的神经模型,以分类更难的仇恨言论类别,并生成目标和隐含信息的描述。
数据集下载
完成简短调查后,可通过此链接下载数据集(2 MB,扩展至6 MB)。
引用信息
Citation:
ElSherief, M., Ziems, C., Muchlinski, D., Anupindi, V., Seybolt, J., De Choudhury, M., & Yang, D. (2021). Latent Hatred: A Benchmark for Understanding Implicit Hate Speech. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP).
BibTeX:
tex @inproceedings{elsherief-etal-2021-latent, title = "Latent Hatred: A Benchmark for Understanding Implicit Hate Speech", author = "ElSherief, Mai and Ziems, Caleb and Muchlinski, David and Anupindi, Vaishnavi and Seybolt, Jordyn and De Choudhury, Munmun and Yang, Diyi", booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing", month = nov, year = "2021", address = "Online and Punta Cana, Dominican Republic", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2021.emnlp-main.29", pages = "345--363" }




