chironzjy/normal_audiotest46
收藏Hugging Face2024-12-07 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/chironzjy/normal_audiotest46
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频、标签和转录文本三个主要特征。标签分为六类:脏话、约会和色情、种族主义、欺凌、其他和无违规。数据集分为一个训练集,包含1920个样本,总大小为598327059.52字节。
The dataset includes three main features: audio, label, and transcription. The audio feature stores audio data, the label feature is a classification label with six categories: Profanity, DatingAndSexting, Racist, Bullying, Other, and NoViolation. The transcription feature stores the text transcription of the audio. The dataset is divided into a training set containing 1920 samples. The download size of the dataset is 483304972 bytes, and the dataset size is 598327059.52 bytes.
提供机构:
chironzjy
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个音频-文本多模态数据集,包含1,920条样本,主要用于内容分类任务,涉及约会与色情内容、污言秽语和无违规三类标签。数据集以parquet格式存储,结合音频文件和转录文本,适用于音频内容安全检测或自然语言处理应用。
以上内容由遇见数据集搜集并总结生成



