ToxiAlert-Bench

Name: ToxiAlert-Bench
Creator: 浙江大学·区块链与数据安全全国重点实验室; 杭州高新区（滨江）区块链与数据安全研究院; 南京理工大学·网络空间安全学院
Published: 2026-05-15 22:17:19
License: 暂无描述

arXiv2026-05-15 更新2026-05-19 收录

下载链接：

https://github.com/yiliang-la/ToxiAlert

下载链接

链接失效反馈

官方服务：

资源简介：

ToxiAlert-Bench是由浙江大学等机构构建的首个面向副语言感知的大规模有毒语音数据集，旨在填补现有文本主导数据集的空白。该数据集包含32,561个音频样本，总时长60.82小时，涵盖19,745个真实语音样本和12,816个合成样本，并标注了7个主要毒性类别和20个细粒度标签。数据集通过双管道构建框架整合多模态模型自动标注与人工验证，创新性地标注了毒性来源（文本/副语言/双重来源）。该数据集主要应用于有毒语音检测领域，特别关注通过语调、情感等副语言线索传递的毒性，为构建更全面的内容审核系统提供数据基础。

ToxiAlert-Bench is the first large-scale toxic speech dataset focused on paralinguistic perception, constructed by institutions including Zhejiang University, aiming to fill the gap in existing text-dominated datasets. This dataset contains 32,561 audio samples with a total duration of 60.82 hours, covering 19,745 real speech samples and 12,816 synthetic samples, and is annotated with 7 major toxicity categories and 20 fine-grained labels. The dataset integrates automatic annotation from multimodal models and manual verification via a dual-pipeline construction framework, and innovatively annotates the source of toxicity (text/paralinguistic/double source). This dataset is primarily applied in the field of toxic speech detection, with particular focus on toxicity conveyed through paralinguistic cues such as intonation and emotion, providing a data foundation for developing more comprehensive content moderation systems.

提供机构：

浙江大学·区块链与数据安全全国重点实验室; 杭州高新区（滨江）区块链与数据安全研究院; 南京理工大学·网络空间安全学院

创建时间：

2026-05-15

原始信息汇总

根据您提供的数据集详情页面地址和README文件内容，由于README文件内容仅包含标题“# ToxiAlert”，无法从页面中获取更多具体信息。以下是基于现有内容的概述：

数据集概述

数据集名称：ToxiAlert
来源：该数据集托管于GitHub平台，地址为：https://github.com/yiliang-la/ToxiAlert
当前可用信息：从README文件内容来看，仅提供了数据集标题，暂无关于数据内容、用途、规模、格式或相关说明的详细介绍。

搜集汇总

数据集介绍

构建方式

ToxiAlert-Bench的构建融合了真实音频与合成语音两条路径。真实部分采自TIMIT、IEMOCAP、VCTK、LibriSpeech等八个广泛使用的公开语料库，共19,745个样本；合成部分则利用GPT-4o生成情感丰富但文本无害的句子，再经由具备多种角色配置的TTS引擎进行语音合成，最终生成12,816个旨在体现副语言毒性的音频片段。在标注环节，研究者采用多模态大模型（Gemini-1.5-Flash、R1-AQA）与GPT-4o协同完成初步筛选与标签提取，并通过一致性校验和人工专家校对（Cohen’s κ=0.82）确保标注质量，最终形成涵盖7个粗粒度毒性与20个细粒度标签的层次化标注体系。

使用方法

数据集按7:1:2比例划分为训练集、验证集与测试集，便于开展监督学习与评估。研究者可基于Wav2Vec 2.0等自监督学习模型构建检测框架，利用数据集提供的双重标注（毒性类别与毒性来源）来训练双头神经网络，其中一头负责毒性来源判别（文本或副语言），另一头负责毒性类别分类。针对类别不平衡问题，可引入类别平衡采样与加权损失函数。实验表明，采用多阶段训练策略（先分别训练两个分类头，再进行联合微调）能显著提升性能。代码与数据集已开源，支持可复现的基准测试与对比研究。

背景与挑战

背景概述

ToxiAlert-Bench是由浙江大学区块链与数据安全全国重点实验室的研究人员于2025年创建的大规模音频毒性检测数据集，旨在填补语音毒性检测领域对副语言线索（如情绪、语调、语速）忽视的空白。随着语音社交平台的兴起，传统基于文本的审核系统无法捕捉仅通过副语言特征（如嘲讽语气或呻吟声）传递的有害意图。该数据集包含超过3万个音频片段，标注了7个主要毒性类别和20个细粒度标签，并创新性地区分了毒性来源（文本内容或副语言线索），为研究副语言感知的毒性检测提供了首个综合性基准，推动了该领域从纯文本分析向多模态理解的关键跨越。

当前挑战

该数据集面临的核心挑战包括：1）领域问题层面，现有方法高度依赖文本内容，忽略了副语言线索在检测嘲讽、恐怖等毒性中的关键作用，导致对仅由语调或情感传递的恶意意图识别失效，亟需构建能同时捕获语义与副语言特征的检测框架；2）构建过程层面，缺乏公开的副语言毒性数据集，需从8个现有语料库（如TIMIT、IEMOCAP）中筛选并标注真实样本，同时通过文本生成与情感语音合成技术创造高质量合成数据，确保副语言毒性的覆盖；此外，还需解决多模态标注一致性（人工与模型标签冲突）、数据类别不平衡及毒性来源的细粒度区分难题，整体流程复杂且工程量大。

常用场景

经典使用场景

在语音安全与内容审核领域，ToxiAlert-Bench最经典的使用场景是作为大规模、多模态的毒性语音检测基准数据集。研究者借助其涵盖30,000余条音频片段、7大毒性类别及20种细粒度标签的丰富标注，系统性地训练和评估模型在识别言语毒性方面的能力。尤为独特的是，该数据集开创性地引入了毒性来源标注机制，区分毒性源自文本语义、副语言线索（如语调、情感、语速）或两者兼有，从而为研发能够捕捉非言语有害信号的检测系统提供了关键的数据基础与评测平台。

解决学术问题

该数据集的问世有效破解了毒性语音检测研究中长期存在的两大瓶颈：公共数据集的匮乏以及对副语言线索的系统性忽视。此前，学术界主要依赖文本审核方法，无法识别通过语调、情感等副语言特征传达的有害意图。ToxiAlert-Bench通过提供包含副语言毒性来源的精细标注，填补了这一研究空白，推动了从纯文本分析向多模态、多线索整合的范式转变。其发布显著促进了模型泛化能力与鲁棒性的研究，并为可重复性科学实践树立了典范，具有深远的学术影响。

实际应用

在实际应用层面，ToxiAlert-Bench赋能了一系列面向语音社交平台的实时内容审核系统。针对Twitch、Slack等直播、多人在线游戏及语音通话平台，传统的文本过滤机制往往失效，而基于该数据集训练的检测模型能够敏锐捕捉由嘲讽语气、恐怖音调或隐性色情声音引发的有害内容。此外，该数据集还可用于构建儿童安全保护机制、心理健康风险预警系统以及社区规范自动化巡查工具，显著提升在线环境的文明程度与用户的心理安全感。

数据集最近研究