TOXICN
收藏arXiv2023-05-08 更新2024-06-21 收录
下载链接:
https://github.com/DUT-lujunyu/ToxiCN
下载链接
链接失效反馈官方服务:
资源简介:
TOXICN数据集由大连理工大学计算机科学与技术学院创建,包含12,011条中文毒性语言样本,涵盖性别歧视、种族歧视、地域偏见和反LGBTQ等多个领域。数据集通过MONITOR TOXIC FRAME分类框架进行细粒度标注,区分直接和间接毒性表达。创建过程中,研究团队构建了包含隐含毒性词汇的侮辱词典,并提出了Toxic Knowledge Enhancement (TKE)基准,以增强文本表示。该数据集旨在解决中文网络环境中毒性语言的细粒度检测问题,为自然语言处理领域的研究提供重要资源。
The TOXICN dataset was created by the School of Computer Science and Technology, Dalian University of Technology. It contains 12,011 Chinese toxic language samples covering multiple domains such as gender discrimination, racial discrimination, regional bias, and anti-LGBTQ sentiments. The dataset was annotated in a fine-grained manner using the MONITOR TOXIC FRAME classification framework to distinguish between direct and indirect toxic expressions. During the dataset creation process, the research team constructed an insult dictionary containing implicit toxic lexicons and proposed the Toxic Knowledge Enhancement (TKE) benchmark to enhance text representations. This dataset aims to address the fine-grained detection of toxic language in Chinese online environments, providing an important resource for research in the field of Natural Language Processing (NLP).
提供机构:
大连理工大学计算机科学与技术学院
创建时间:
2023-05-08
搜集汇总
数据集介绍

构建方式
为了促进对中文有害语言的细粒度检测,研究者们构建了MONITOR TOXIC FRAME这一分层分类法,以分析有害类型和表达方式。在此基础上,他们提出了一个细粒度数据集TOXICN,其中包括直接和间接的有害样本。数据集的构建首先涉及从两个公共在线媒体平台Zhihu和Tieba爬取帖子,并经过敏感话题筛选和关键字提取。随后,采用MONITOR TOXIC FRAME进行标注,通过伪标注和主要手动标注两个步骤,并使用开源文本标注工具Doccano辅助标注过程。最后,对数据进行去敏化处理,保留emoji以供检测。
特点
TOXICN数据集具有以下特点:1. 分离了仇恨言论和一般性攻击性言论;2. 包含直接和间接表达的有害样本;3. 构建了一个包含隐含侮辱和明确侮辱的侮辱词典;4. 提出了一个名为Toxic Knowledge Enhancement (TKE)的基准,将词汇特征融入文本表示中,以检测有害语言。数据集涵盖了性别、种族、地域和LGBTQ等主题的有害样本,具有多样性。
使用方法
TOXICN数据集以JSON格式存储,每个样本包含ID、平台、主题、文本、是否有害语言、是否为仇恨言论、目标群体和表达方式等信息。使用该数据集时,可以将其分割为训练集和测试集,利用预训练语言模型等方法进行有害语言检测。在检测过程中,可以引入TKE基准,以增强模型对有害语言的检测能力。此外,还可以通过分析侮辱词典和样本统计信息,进一步了解有害语言的特点和规律。
背景与挑战
背景概述
随着社交媒体的普及,网络暴力和恶意言论的传播对社会造成了严重危害。针对中文网络暴力语言的检测研究相对滞后,现有的数据集缺乏对恶意言论类型的细粒度标注,且忽略了间接恶意言论的样本。此外,引入词汇知识来检测恶意言论的毒性一直是研究人员的挑战。为了促进中文恶意言论的细粒度检测,研究人员构建了MONITOR TOXIC FRAME,一个用于分析恶意类型和表达的层次分类法。基于此分类法,提出了细粒度数据集TOXICN,包括直接和间接恶意样本。此外,还构建了一个包含隐含侮辱和侮辱性词汇的知识库,并提出了 Toxic Knowledge Enhancement (TKE) 作为基准,将词汇特征用于检测恶意言论。实验结果表明,TKE在检测恶意言论方面具有有效性。
当前挑战
中文恶意言论检测面临的挑战包括:1) 区分恶意言论类型和一般性侮辱性语言的挑战;2) 识别间接表达,包括隐含仇恨和报道歧视经历的样本的挑战;3) 构建包含隐含侮辱性词汇的知识库的挑战;4) 在不增加模型偏差的情况下引入外部知识以增强模型检测能力的挑战。
常用场景
经典使用场景
TOXICN数据集构建了一个层次化的分类体系MONITOR TOXIC FRAME,以分析有毒类型和表达。该数据集包括直接和间接的有毒样本,涵盖了性别歧视、种族主义、地区偏见和反LGBTQ等话题。此外,还构建了一个侮辱词典,包含隐含的侮辱和毒词。基于这些资源和分类体系,TOXICN数据集为研究有毒语言检测提供了丰富的实验数据。
实际应用
TOXICN数据集的实际应用场景包括社交媒体平台的有毒内容检测、网络论坛的有毒评论过滤、聊天机器人中的有毒语言识别等。该数据集可以帮助社交媒体平台和论坛管理员及时发现和过滤有毒内容,提高用户的使用体验和社区环境的健康程度。此外,TOXICN数据集还可以用于聊天机器人中的有毒语言识别,避免机器人在与用户交互时产生不良影响。
衍生相关工作
TOXICN数据集的构建和分类体系为有毒语言检测领域的研究提供了重要的基础和参考。基于TOXICN数据集,研究人员可以进一步研究有毒语言检测的算法和模型,提高检测模型的性能和准确性。此外,TOXICN数据集还可以用于研究有毒语言的社会影响和应对策略,为制定相关政策和措施提供科学依据。
以上内容由遇见数据集搜集并总结生成



