THOS
收藏arXiv2023-11-11 更新2024-06-21 收录
下载链接:
https://github.com/mohaimeed/THOS
下载链接
链接失效反馈官方服务:
资源简介:
THOS数据集是由中佛罗里达大学和佛罗里达国际大学的研究团队创建的,包含8,282条经过精细标注的推文,主要用于训练和验证针对特定目标的仇恨和攻击性言论的分类器。该数据集通过Twitter API收集,涵盖了多种目标类别,如国家、宗教、种族和政治等,以及更具体的子类别。数据集的创建过程中,专家参与了标注工作,确保了标注的准确性和一致性。THOS数据集的应用领域主要集中在社交媒体内容监控,旨在识别和分类有害内容,以促进网络环境的净化和安全。
The THOS Dataset was created by research teams from the University of Central Florida and Florida International University. It contains 8,282 meticulously annotated tweets, primarily used for training and validating target-specific hate speech and offensive language classifiers. Collected via the Twitter API, the dataset covers multiple target categories such as countries, religions, ethnic groups, politics, as well as more specific subcategories. During the dataset creation process, experts participated in the annotation work to ensure the accuracy and consistency of the annotations. The main application areas of the THOS Dataset focus on social media content monitoring, aiming to identify and classify harmful content so as to promote the purification and safety of the online environment.
提供机构:
中佛罗里达大学计算机科学系, 佛罗里达国际大学
创建时间:
2023-11-11
搜集汇总
数据集介绍

构建方式
在社交媒体内容治理领域,针对有害言论的细粒度识别需求日益凸显。THOS数据集的构建遵循了系统化原则,通过Twitter API采集了约31,000条推文,并采用关键词筛选策略,聚焦于国家、宗教、种族等常见仇恨言论目标类别。为确保标注质量,研究团队摒弃了众包模式,转而邀请五位领域专家参与人工标注,并制定了详尽的标注规则文档以统一标准。标注过程中,专家可跳过模糊或无效内容,最终形成了包含8,282条推文的高质量数据集,每条推文均标注了仇恨言论、冒犯性语言及两级目标类别(通用主题与具体子主题)的布尔标签。
特点
THOS数据集的显著特征在于其精细的标注维度与高质量的人工标注。相较于既往数据集,它不仅区分仇恨言论与冒犯性语言,更创新性地引入了两级目标分类体系:第一级涵盖国家、宗教、种族、政治等通用主题;第二级则细化至美国、穆斯林、黑人等具体子主题。这种结构使得数据能够支持对言论目标的深入分析。此外,数据集中约55%的仇恨言论实例不包含冒犯性词汇,揭示了仅依赖关键词检测的局限性,凸显了语境理解在仇恨言论识别中的关键作用。
使用方法
该数据集主要用于训练和评估细粒度的有害言论分类模型。研究者可基于THOS微调BERT、RoBERTa等大型语言模型,以同时预测仇恨/冒犯性标签及目标类别。实验表明,即使仅使用文本输入,模型也能在目标分类上取得较高准确率;若结合已知目标信息(如来自上下文),则可进一步提升子主题分类性能。THOS适用于社交媒体平台的内容审核趋势分析、特定群体仇恨言论监测等场景,为开发更精准、可解释的分类系统提供了可靠的数据基础。
背景与挑战
背景概述
在社交媒体内容治理领域,针对有害言论的自动检测技术已成为学术界与工业界共同关注的焦点。THOS数据集由中佛罗里达大学与佛罗里达国际大学的研究团队于2023年联合构建,旨在解决现有仇恨与冒犯性言论数据集中目标标注粒度不足的问题。该数据集包含8.3万条经过人工精细标注的推文,不仅区分仇恨言论与冒犯性内容,更创新性地引入目标主题类别与具体子类别的双层标注体系,涵盖国家、宗教、种族、政治等维度。其构建基于领域专家标注机制,显著提升了标注一致性与可靠性,为基于大语言模型的细粒度分类器训练提供了关键数据支撑,推动了社交媒体内容安全分析向精准化、场景化方向发展。
当前挑战
THOS数据集致力于解决仇恨与冒犯性言论检测中目标识别粒度不足的核心挑战。传统数据集多局限于二元或粗粒度分类,难以捕捉言论针对的具体群体与语境差异,导致模型在实际应用中易产生误判。在构建过程中,研究团队面临多重挑战:其一,标注体系需平衡语义广度与深度,既要覆盖常见目标类别,又需应对语言表达中隐含目标的模糊性;其二,专家标注虽提升质量,但面临标注成本高、规模受限的权衡;其三,数据采集依赖关键词筛选,可能引入样本分布偏差,例如政治类目标样本量显著不足。这些挑战凸显了细粒度有害言论数据集构建在标注设计、资源投入与数据代表性方面的复杂性。
常用场景
经典使用场景
在社交媒体内容审核领域,THOS数据集为细粒度的仇恨与冒犯性言论检测提供了关键支持。该数据集通过人工标注的8.3k条推文,不仅区分了仇恨言论与冒犯性语言,还详细标注了言论的目标类别与具体子类,如国家、宗教、种族等。这使得研究者能够基于大型语言模型训练高精度的多标签分类器,实现对有害内容的精准识别与归类,从而推动自动化内容过滤技术的发展。
实际应用
在实际应用中,THOS数据集可被社交媒体平台用于构建智能内容审核系统。通过训练基于该数据集的分类器,平台能够自动识别针对特定群体(如少数族裔、宗教团体)的仇恨言论,并实时监控相关趋势。此外,政府部门与研究机构可利用该数据集分析社会仇恨情绪的演变,为政策制定与社会干预提供数据支持,从而促进网络环境的健康发展与公共安全。
衍生相关工作
THOS数据集的发布催生了一系列基于细粒度目标检测的衍生研究。例如,研究者利用其分层标注结构开发了多任务学习模型,同时预测言论的仇恨属性与目标类别;另有工作结合上下文信息(如用户历史或社区背景)进一步提升了分类精度。这些工作扩展了仇恨言论检测的边界,推动了如HateXplain等数据集的优化,并为跨语言、跨平台的有害内容分析提供了新范式。
以上内容由遇见数据集搜集并总结生成



