SALT-NLP/ImplicitHate

Name: SALT-NLP/ImplicitHate
Creator: SALT-NLP
Published: 2023-02-16 23:00:38
License: 暂无描述

Hugging Face2023-02-16 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/SALT-NLP/ImplicitHate

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含22,056条来自美国极端主义群体的推文，其中6,346条包含隐性仇恨言论。这些隐性仇恨言论被进一步分类为七种类型：不满、煽动、低劣、讽刺、刻板印象、威胁和其他。每条隐性仇恨推文还附有目标人群和隐含信息的自由文本注释。数据集可用于训练神经网络模型以识别和解释隐性仇恨言论。

This dataset contains 22,056 tweets sourced from extremist groups in the United States, among which 6,346 involve implicit hate speech. These implicit hate speech instances are further categorized into seven types: resentment, incitement, inferiority, sarcasm, stereotyping, threats, and others. Each implicit hate speech tweet is additionally paired with free-text annotations detailing the targeted population and the implied message. This dataset can be utilized to train neural network models for recognizing and interpreting implicit hate speech.

提供机构：

SALT-NLP

原始信息汇总

数据集概述：Implicit Hate Speech

数据集名称

Implicit Hate Speech

数据集描述

该数据集包含来自美国最突出极端主义团体的22,056条推文，其中6,346条包含隐性仇恨言论。隐性仇恨类别通过以下分类进行分解：

Grievance (24.2%): 对少数群体的特权感到不满。
Incitement (20.0%): 间接推广已知的仇恨团体和意识形态。
Inferiority (13.6%): 暗示某些群体或个人价值低于其他。
Irony (12.6%): 使用讽刺、幽默和讽刺来贬低某人。
Stereotypes (17.9%): 使用委婉语、迂回或比喻语言将群体与负面属性关联。
Threats (10.5%): 间接承诺攻击某人的身体、福祉、名誉、自由等。
Other (1.2%): 其他。

每条6,346条隐性仇恨推文还包括目标人口群体和隐含声明的自由文本注释，以描述潜在信息。

数据集用途

该数据集可用于训练最先进的神经模型，以分类更难的仇恨言论类别，并生成目标和隐含信息的描述。

数据集下载

完成简短调查后，可通过此链接下载数据集（2 MB，扩展至6 MB）。

引用信息

Citation:

ElSherief, M., Ziems, C., Muchlinski, D., Anupindi, V., Seybolt, J., De Choudhury, M., & Yang, D. (2021). Latent Hatred: A Benchmark for Understanding Implicit Hate Speech. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP).

BibTeX:

tex @inproceedings{elsherief-etal-2021-latent, title = "Latent Hatred: A Benchmark for Understanding Implicit Hate Speech", author = "ElSherief, Mai and Ziems, Caleb and Muchlinski, David and Anupindi, Vaishnavi and Seybolt, Jordyn and De Choudhury, Munmun and Yang, Diyi", booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing", month = nov, year = "2021", address = "Online and Punta Cana, Dominican Republic", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2021.emnlp-main.29", pages = "345--363" }

搜集汇总

数据集介绍

构建方式

在社交媒体内容安全分析领域，隐式仇恨言论的识别构成了一项严峻挑战。该数据集构建于对美国境内主要极端主义群体发布的推文进行系统性采集，共汇集了22,056条文本。其中，6,346条被标注为隐式仇恨言论，并依据精细的语用学分类体系进行分解，涵盖申诉、煽动、贬低、反讽、刻板印象、威胁及其他类别。每条隐式仇恨推文均辅以自由文本标注，指明目标人口群体及其隐含陈述，从而构建了一个兼具广度与深度的基准语料库。

使用方法

该数据集主要服务于自然语言处理领域的前沿研究，特别是针对隐式仇恨言论的检测与解释任务。研究者可利用其训练先进的神经网络模型，以提升对非显性仇恨表达的识别能力。此外，数据集中的隐含陈述与目标群体标注，为模型的可解释性研究及条件文本生成任务提供了监督信号。通过微调预训练语言模型，可探索其在隐式仇恨分类、细粒度类别判别以及隐含信息生成等方向上的性能，推动社交媒体内容安全分析技术的发展。

背景与挑战

背景概述

在自然语言处理领域，隐式仇恨言论的识别构成了一个复杂且紧迫的研究议题。SALT-NLP/ImplicitHate数据集由Mai ElSherief等学者于2021年构建，旨在为理解隐式仇恨言论提供基准。该数据集聚焦于美国极端主义团体在社交媒体上发布的推文，通过精细标注揭示了隐式仇恨的多种表现形式，如申诉、煽动、贬低、反讽、刻板印象和威胁等。其核心研究问题在于如何有效检测和解释那些缺乏明显仇恨词汇却蕴含恶意意图的文本，从而弥补传统关键词检测系统的不足。该数据集的发布推动了仇恨言论检测模型向更深层次语义理解的发展，对社交媒体内容治理和在线安全研究产生了显著影响。

当前挑战

隐式仇恨言论检测面临双重挑战。在领域问题层面，隐式仇恨往往通过隐喻、反讽或委婉语等微妙方式表达，使得基于表面特征的模型难以准确识别；同时，模型需区分恶意意图与无害的讽刺或批评，这对上下文理解和常识推理提出了更高要求。在构建过程中，数据收集需从极端主义群体中筛选具有代表性的隐式内容，标注工作则依赖人工对隐含目标和潜在信息进行解释，这要求标注者具备深厚的文化和社会背景知识，以确保标注的一致性和准确性。此外，平衡数据中不同隐式类别的分布，避免模型偏见，也是构建过程中的关键难点。

常用场景

经典使用场景

在社交媒体内容审核领域，隐式仇恨言论的识别一直是一项严峻挑战。SALT-NLP/ImplicitHate数据集通过标注超过六千条隐式仇恨推文，为自然语言处理模型提供了精准的训练基准。该数据集常用于训练和评估深度学习模型，以区分显性与隐式仇恨表达，尤其侧重于从反讽、隐喻和委婉语中捕捉潜在恶意。

解决学术问题

该数据集有效解决了仇恨言论检测中语义模糊性的学术难题。通过细粒度标注体系，它将隐式仇恨分解为申诉、煽动、贬低、反讽、刻板印象和威胁等六类，为理解语言中的隐蔽偏见提供了结构化框架。这不仅推动了细粒度文本分类研究，还为生成式模型解释隐含语义提供了评估基础。

实际应用

在实际应用中，该数据集被整合到社交媒体平台的内容过滤系统中。通过训练基于Transformer的检测模型，平台能够识别极端团体使用的隐蔽攻击性语言，辅助人工审核团队优先处理高风险内容。同时，其隐含语句生成标注可用于开发解释性工具，帮助普通用户理解隐式仇恨的潜在危害。

数据集最近研究