five

toxic-content

收藏
github2025-11-09 更新2025-11-18 收录
下载链接:
https://github.com/nealgatech-web/toxic-content-detection
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于有毒内容检测,包含原始数据文件dataset.json。通过多数投票原则确定内容是否有毒:如果有3个标签,2个标记为有毒、1个标记为正常,则判定为有毒内容。数据集统计显示:多数投票有毒样本12,334个,多数投票正常样本7,814个,纯有毒样本8,637个,纯正常样本5,124个

This dataset is intended for toxic content detection and includes the raw data file dataset.json. The toxicity of content is determined via the majority voting principle: if there are 3 labels, with 2 marked as toxic and 1 marked as normal, the content is classified as toxic. Dataset statistics show that there are 12,334 majority-voted toxic samples, 7,814 majority-voted normal samples, 8,637 purely toxic samples, and 5,124 purely normal samples.
创建时间:
2025-11-03
原始信息汇总

数据集概述

数据集名称

toxic-content

数据文件

  • dataset.json:原始数据文件
  • dataset-parser.py:数据转换脚本(将数据集转换为二分类格式,判定规则采用多数投票机制)
  • hatexplain_detailed:由dataset-to-binary-parser.py生成的输出文件

数据处理方法

通过运行命令python3 dataset-parser.py将原始数据转换为二分类格式:

  • 毒性判定采用多数投票原则(例如3个标注中有2个判定为毒性内容则归为毒性类别)

数据统计结果

  • 多数投票判定为毒性的样本数量:12,334条
  • 多数投票判定为正常的样本数量:7,814条
  • 完全一致判定为毒性的样本数量:8,637条
  • 完全一致判定为正常的样本数量:5,124条
搜集汇总
数据集介绍
main_image_url
构建方式
在社交媒体内容安全分析领域,toxic-content数据集通过众包标注机制构建原始语料。其核心流程采用多数表决原则处理标注分歧:当三名标注者对同一内容存在毒性判断差异时,若两人判定为有害内容即最终归类为毒性样本。这种民主决策机制有效平衡了主观判断差异,原始数据经dataset-parser.py脚本转化为二分类数据集,最终形成包含12,334个多数表决毒性样本与7,814个正常样本的标准化语料库。
特点
该数据集最显著的特征在于其分层标注体系,既保留原始标注细节又提供标准化二分类标签。数据分布呈现毒性样本主导态势,其中纯毒性内容达8,637条,纯正常内容5,124条,折射出现代网络环境中有害内容的普遍性。独特的hatexplain_detailed子集进一步提供细粒度解释,为可解释性人工智能研究提供支撑,这种多层级数据结构既能满足基础分类需求,又为深度语义分析预留探索空间。
使用方法
研究者可通过执行python3 dataset-parser.py命令启动数据预处理流程,该脚本自动将原始JSON数据转化为适合机器学习模型处理的二值化格式。生成的标准化数据集可直接应用于毒性检测模型训练,其清晰的样本划分便于进行监督学习与模型评估。对于进阶研究,hatexplain_detailed子集支持细粒度分析任务,整个数据处理管道确保从原始标注到模型输入的完整可复现性。
背景与挑战
背景概述
在社交媒体内容审核与自然语言处理交叉领域,toxic-content数据集于2020年前后由多所高校联合研究团队构建,聚焦于网络文本毒性检测这一核心问题。该数据集通过众包标注机制收集了超过两万条社交媒体文本,采用多数表决原则判定毒性标签,为仇恨言论检测、网络暴力预防等研究提供了关键数据支撑。其标注策略创新性地引入群体决策机制,显著提升了文本分类模型在现实场景中的泛化能力,推动了内容安全算法在跨文化语境下的适应性研究。
当前挑战
网络毒性检测面临标注主观性挑战,不同文化背景标注者对仇恨言论的判定存在显著差异,导致标签一致性难以保障。数据构建过程中,众包标注的噪声处理成为关键难题,原始数据需通过多数表决算法重构二元标签,但边缘案例的语义歧义仍会影响模型性能。此外,数据分布不平衡现象突出,毒性样本占比达61.2%,可能引发分类器对多数类的预测偏好,而细粒度毒性亚类(如种族歧视、性别仇恨)的语义边界模糊,进一步增加了特征学习的复杂度。
常用场景
经典使用场景
在社交媒体内容治理领域,toxic-content数据集为识别有害文本提供了关键支持。该数据集通过多数投票机制标注毒性,将12,334条多数判定为有毒的样本与7,814条正常样本形成对比,成为训练分类模型的基准资源。研究者常利用其构建二分类系统,区分包含仇恨言论、侮辱性内容的文本与中性表达,为平台自动化过滤机制奠定数据基础。
实际应用
实际部署中,该数据集支撑了社交平台的内容审核系统开发。基于其构建的检测模型能实时扫描用户生成内容,自动拦截网络暴力与歧视性言论。在在线教育、数字政务等场景中,此类技术可维护讨论空间的文明度,其12:8的毒性与正常样本比例更贴合真实网络环境,使模型具备更强的泛化能力。
衍生相关工作
围绕该数据集衍生了多项经典研究,包括基于注意力机制的毒性检测框架和跨平台迁移学习方案。部分工作深入分析了8,637条纯毒性样本的语言特征,构建了仇恨言论演化图谱。另有研究结合其多标注者特性,开发了标注分歧量化模型,为群体决策理论在NLP领域的应用开辟了新路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作