toxic-content

github2025-11-09 更新2025-11-18 收录

下载链接：

https://github.com/nealgatech-web/toxic-content-detection

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于有毒内容检测，包含原始数据文件dataset.json。通过多数投票原则确定内容是否有毒：如果有3个标签，2个标记为有毒、1个标记为正常，则判定为有毒内容。数据集统计显示：多数投票有毒样本12,334个，多数投票正常样本7,814个，纯有毒样本8,637个，纯正常样本5,124个

This dataset is intended for toxic content detection and includes the raw data file dataset.json. The toxicity of content is determined via the majority voting principle: if there are 3 labels, with 2 marked as toxic and 1 marked as normal, the content is classified as toxic. Dataset statistics show that there are 12,334 majority-voted toxic samples, 7,814 majority-voted normal samples, 8,637 purely toxic samples, and 5,124 purely normal samples.

创建时间：

2025-11-03

原始信息汇总

数据集概述

数据集名称

toxic-content

数据文件

dataset.json：原始数据文件
dataset-parser.py：数据转换脚本（将数据集转换为二分类格式，判定规则采用多数投票机制）
hatexplain_detailed：由dataset-to-binary-parser.py生成的输出文件

数据处理方法

通过运行命令python3 dataset-parser.py将原始数据转换为二分类格式：

毒性判定采用多数投票原则（例如3个标注中有2个判定为毒性内容则归为毒性类别）

数据统计结果

多数投票判定为毒性的样本数量：12,334条
多数投票判定为正常的样本数量：7,814条
完全一致判定为毒性的样本数量：8,637条
完全一致判定为正常的样本数量：5,124条

搜集汇总

数据集介绍

构建方式

在社交媒体内容安全分析领域，toxic-content数据集通过众包标注机制构建原始语料。其核心流程采用多数表决原则处理标注分歧：当三名标注者对同一内容存在毒性判断差异时，若两人判定为有害内容即最终归类为毒性样本。这种民主决策机制有效平衡了主观判断差异，原始数据经dataset-parser.py脚本转化为二分类数据集，最终形成包含12,334个多数表决毒性样本与7,814个正常样本的标准化语料库。

特点

该数据集最显著的特征在于其分层标注体系，既保留原始标注细节又提供标准化二分类标签。数据分布呈现毒性样本主导态势，其中纯毒性内容达8,637条，纯正常内容5,124条，折射出现代网络环境中有害内容的普遍性。独特的hatexplain_detailed子集进一步提供细粒度解释，为可解释性人工智能研究提供支撑，这种多层级数据结构既能满足基础分类需求，又为深度语义分析预留探索空间。

使用方法

研究者可通过执行python3 dataset-parser.py命令启动数据预处理流程，该脚本自动将原始JSON数据转化为适合机器学习模型处理的二值化格式。生成的标准化数据集可直接应用于毒性检测模型训练，其清晰的样本划分便于进行监督学习与模型评估。对于进阶研究，hatexplain_detailed子集支持细粒度分析任务，整个数据处理管道确保从原始标注到模型输入的完整可复现性。

背景与挑战

背景概述

在社交媒体内容审核与自然语言处理交叉领域，toxic-content数据集于2020年前后由多所高校联合研究团队构建，聚焦于网络文本毒性检测这一核心问题。该数据集通过众包标注机制收集了超过两万条社交媒体文本，采用多数表决原则判定毒性标签，为仇恨言论检测、网络暴力预防等研究提供了关键数据支撑。其标注策略创新性地引入群体决策机制，显著提升了文本分类模型在现实场景中的泛化能力，推动了内容安全算法在跨文化语境下的适应性研究。

当前挑战

网络毒性检测面临标注主观性挑战，不同文化背景标注者对仇恨言论的判定存在显著差异，导致标签一致性难以保障。数据构建过程中，众包标注的噪声处理成为关键难题，原始数据需通过多数表决算法重构二元标签，但边缘案例的语义歧义仍会影响模型性能。此外，数据分布不平衡现象突出，毒性样本占比达61.2%，可能引发分类器对多数类的预测偏好，而细粒度毒性亚类（如种族歧视、性别仇恨）的语义边界模糊，进一步增加了特征学习的复杂度。

常用场景

经典使用场景

在社交媒体内容治理领域，toxic-content数据集为识别有害文本提供了关键支持。该数据集通过多数投票机制标注毒性，将12,334条多数判定为有毒的样本与7,814条正常样本形成对比，成为训练分类模型的基准资源。研究者常利用其构建二分类系统，区分包含仇恨言论、侮辱性内容的文本与中性表达，为平台自动化过滤机制奠定数据基础。

实际应用

实际部署中，该数据集支撑了社交平台的内容审核系统开发。基于其构建的检测模型能实时扫描用户生成内容，自动拦截网络暴力与歧视性言论。在在线教育、数字政务等场景中，此类技术可维护讨论空间的文明度，其12:8的毒性与正常样本比例更贴合真实网络环境，使模型具备更强的泛化能力。

衍生相关工作

围绕该数据集衍生了多项经典研究，包括基于注意力机制的毒性检测框架和跨平台迁移学习方案。部分工作深入分析了8,637条纯毒性样本的语言特征，构建了仇恨言论演化图谱。另有研究结合其多标注者特性，开发了标注分歧量化模型，为群体决策理论在NLP领域的应用开辟了新路径。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集